CRF++分词工具,CRF++是著名的条件随机场的开源工具,也是目前综合性能最佳的CRF工具,主要用于文本标注,分词、词性标注、命名实体识别等领域!
功能介绍
doc文件夹:就是官方主页的内容
example文件夹:有四个任务的训练数据(test.data)、测试数据(train.data)和模板文件(template),还有一个执行脚本文件exec.sh。
sdk文件夹:CRF++的头文件和静态链接库。
clr_learn.exe:CRF++的训练程序
crl_test.exe:CRF++的测试程序
libcrffpp.dll:训练程序和测试程序需要使用的静态链接库。
实际上,需要使用的就是crf_learn.exe,crf_test.exe和libcrfpp.dll,这三个文件。
使用方法
1、解压后将crf_learn.execrf_test.exelibcrfpp.dll文件复制到example文件夹的任意文件夹下
2、打开CMD命令行模式cd到1中目录。
3、输入指令crf_learntemplatetrain.datamodel即可生成model文件