-
Notifications
You must be signed in to change notification settings - Fork 271
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[ERROR] 出現 >> [Gensim] 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte #36
Comments
這種編碼錯誤是 gensim 在載入詞向量失敗時所導致,我猜有兩個可能性。 一種是載入方法不對, 第二種是詞向量本身有問題, 祝順利 |
@zake7749 那版主大大,您有辦法提供你訓練好的model來讓我做使用嗎,十萬分感謝 |
中文的可以使用這個。 |
哈囉大大,先謝謝你提供訓練好的模型,後來可以成功運作了,而且我自己有再用其他語料集訓練出模型,也可以被載入。 |
對,是這樣沒錯。 |
如果我單純想用自己的訓練的model回應就好呢~該怎麼設定 |
似乎沒有寫這種功能,不過調用 listen 時設定 |
調整成這樣是指 主要以自己訓練的model來進行回應嗎 |
是的,這樣調整是基於 word2vec 的規則比對,不會去撈 ptt 的 dataset |
大大我照你的方式調整完,他都只會出現預設的 "是嗎?", "我不太明白你的意思", "原來如此"這三個詞.... |
中文的也已经下载不了了,能麻烦您再传一次么 |
請問大神,這個錯誤該怎麼解決,拜託幫忙了~~感覺差一點點可以完成
console檔程式碼如下
==========================================================
import random
import os
import jieba
import jieba.analyse
import RuleMatcher.rulebase as rulebase
class Console(object):
if name == 'main':
main()
The text was updated successfully, but these errors were encountered: