fukuball / jieba-php

"結巴"中文分詞:做最好的 PHP 中文分詞、中文斷詞組件。 / "Jieba" (Chinese for "to stutter") Chinese text segmentation: built to be the best PHP Chinese word segmentation module.

Home Page:http://jieba-php.fukuball.com

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

请问如何提高执行速度

graycatclub opened this issue · comments

您好:
我用的small库,每次一句有10个汉子左右,可是每次执行都要3-4秒,如何能提高速度呢,精简词库也可以。

您好,目前主要的瓶頸在載入詞典的時候,只要詞典載入之後,多少句子、多少字數基本上不會影響到太多時間,因此在做分詞前處理時可以考慮一次將所有文本進行分詞,而不要一句一句來執行,以避過前面必要載入詞典的 over head(3 secs)。

您好,請問載入詞典是哪一個檔案呢?我想去精簡詞典,這樣可以提高速度嗎?我寫的是一個網頁程式,用戶按鍵就返回結果。要分詞的句子只有十個字符左右,而最終結果,可能1-2個詞就夠了。
謝謝您!

不好意思,是我拼错。改用small库,1秒出结果,应该可以接受了,谢谢您!

@graycatclub 喔喔 好的 沒問題~