交通大學語音實驗室線上繁體中文剖析器
NCTU Traditional Chinese Shallow Parser - Speech Lab, NCTU

使用者輸入(Input your text here, less than 700 characters) 

斷詞輸出格式:

<BP> word(POS) word(POS) </BP>

其中
POS 使用的是中研院詞庫小組之46類標記
<BP> 及 </BP> 為base-phrase之標記
Base-phrase 共分 GP, NP, PP, S, VP, XP(ADVP及X‧DE)

範例:
<NP>交通(Nb) 大學(Nc)</NP> 語音(Na) 實驗室(Nc) 線上(Nc) 中文(Na) 剖析器(Na) 。(PM)

本系統會持續更新,請注意更新日期及系統版本
如果您發現任何問題, 請向我反應, 我將設法改善

註1 : [已知問題] 輸入中的半型空白會被HTML form 指令轉換為+,欲輸入空白請使用全型空白。
註2 : 斷詞器中已加入異體字之轉換及一些常見錯別字之修正。
註3 : 本系統將不會改善BP chunker效能,因為我們正在發展dependency parser。
註4 : 您的錯誤回報將有助於系統效能改善。
註5 : 根據 Zipf's law, 要改善本斷詞器斷詞結果, 越來越困難, 不過我還是會盡力去做。
註6 : 如需大量斷詞, 煩請告知, 以免系統會封鎖您的IP。

錯誤回報 : 交大電機系 王逸如, email : yrwang@speech.cm.nctu.edu.tw
更新日期 : 2022/05/04
系統版本 : 0.8798.1702.0

本系統使用 Dr. Taku Kudo 之 CRF++ 套件及中研院Sinica Corpus 語料庫 經大量錯誤更正後訓練發展而成。
本系統限非商業目的使用。