CRF++是一款非常好用的公詞工具,CRF++是著名的條件隨機場的開源工具,也是目前綜合性能最佳的CRF工具,主要用于文本標(biāo)注,分詞、詞性標(biāo)注、命名實體識別等領(lǐng)域!
???????CRF++功能介紹
doc文件夾:官方主頁的內(nèi)容。
example文件夾:有四個任務(wù)的訓(xùn)練數(shù)據(jù)(test.data)、測試數(shù)據(jù)(train.data)和模板文件(template)和腳本文件exec.sh。
sdk文件夾:CRF++的頭部文件和靜態(tài)鏈接庫。
clr_learn.exe:CRF++的培訓(xùn)步驟。
crl_test.exe:CRF++的測試程序。
libcrffpp.dll:訓(xùn)練程序和測試程序所需的靜態(tài)鏈接庫。
實際上,需要使用crf_learn.exe、crf_test.exe和libcrfpp.dll三個文件。
???????CRF++使用方法
1、解壓后將crf_learn.exe crf_test.exe libcrfpp.dll文件復(fù)制到example文件夾的任意文件夾下
2、打開CMD命令行模式cd到1中目錄。
3、輸入指令crf_learn template train.data model即可生成model文件