10日記
發布時間:
3月以來,感覺在學習道路上有了點提升,再不寫寫日記,我怕以后啥都不知道了。要點:1.從自然語言那本書和視頻大概了解了一些信息,比如說
3月以來,感覺在學習道路上有了點提升,再不寫寫日記,我怕以后啥都不知道了。要點:
1.從自然語言那本書和視頻大概了解了一些信息,比如說,分詞,詞性標注,關鍵詞提取,詞向量訓教。其實這四個將會是未來用的相當多的方面
2.從tensorflow構建典型的cnn,lstm,bilstm網絡,但是參數和優化,以及損失這些有待提高
上面學到的東西,反過頭來,問題出現了:
1.HMM,crf這兩種模型,目前是根本不知道咋回事兒的,以至于在詞性標注方面,空白。
2.語料的訓練,形成詞庫。語料又訓教成詞向量(帶有緯度的訓練,以及參數的設置),詞向量的保存,加載。
3.tensorflow構建模型,輸入整數最好。因此還要加現有的數據集,訓練為62774*n維的矩陣
4.多注意力的加入,在設置好bilstm模型了,該在哪里寫上這一代碼,還要多看論文。
5.下一步,選擇適合的方面去應用。下周總結,希望能解決絕大多數現存問題。








