c语言中的中文分词
没有网上公告,需要咨询专业人士。
c语言是一种面向过程的抽象通用编程语言,广泛应用于底层开发。c语言可以用简单的方式编译处理低级内存。
c语言是一种高效的编程语言,只产生少量的机器语言,不需要任何运行环境的支持就可以运行。C语言虽然提供了很多底层处理功能,但仍然保持了跨平台的特性。用标准规范编写的c语言程序可以在许多计算机平台上编译,包括嵌入式处理器和超级计算机等操作平台。
c语言诞生于美国贝尔实验室,由丹尼斯·里奇在肯·汤普森设计的B语言基础上发展而来。它的主要设计完成后,汤普森和里奇用它彻底改写了UNIX,并且随着UNIX的发展,C语言得到了不断的完善。
为了全面推广C语言,许多专家学者和硬件厂商联合组成了C语言标准委员会,并于1989年诞生了第一个完整的C标准,缩写为“C89”或“ANSI C”。到2020年,最新的C语言标准是2018年6月发布的“C18”。
如何用C语言调用NLPIR进行中文分词 1.打开vs后,创建一个新项目,如下所示。新项目的名称是文本分割。构建完成后,一个文本分段文件夹将出现在您选择的目录中。
2.从nlpir官网下载相关资源,这里是2013版。下载地址:
3.解压下载的文件,找到Data文件夹,bin文件夹中的NLPIR.h文件,include文件夹和lib文件夹中的NLPIR.h文件。
在NLPIR.lib文件中,将这四样东西复制到刚才text-segmentation文件夹中的text-segmentation文件夹,如下所示
效果:
4.单击文本分段。SLN在文本分割文件夹下打开这个项目,将NLPIR.h文件添加到头文件中,如下所示。
5.单击项目-属性(快捷键ALT
F7),设置如下图所示。不要问我为什么这样设置,我也不懂。我摸索了很久,没有也做不到。
6.在source中创建新程序,并创建新的C源程序。
7.接下来,您可以在这里编写代码。我附上我的一段代码作为例子。最重要的是前面的函数头,可以直接复制。
#ifndef OS_LINUX
#包括
#pragma注释(lib," NLPIR.lib ")
#endif
#包括
#包括
#包括
#包括
#包括
#包含“NLPIR.h”
#包括
使用命名空间std
void IfInit();//判断是否初始化成功。
void if exit();//是否成功退出?
int main()
{
IfInit();//初始化程序
nl PIR _ SetPOSmap(ICT _ POS _ MAP _ SECOND);
int nitems//
nitems = nl PIR _ import user dict(" H:\ \ sentence \ \ user dict _ manual . txt ");
nl PIR _ SaveTheUsrDic();
cout"import "nitems "
单词“endl
//NLPIR_AddUserWord("A股");
//NLPIR_AddUserWord("上证指数");
//int I;
//char sC语言分词和显示书写功能? void输入(char *str) {
char c;
int I = 0;
while ( (c = getchar())!= '\n' i 81) {
*(str I)= c;
我;
}
}
int Split_Count (char *str,char **pStr) {
int count = 0,is_word = 0,j = 0;
char tmp[81];
for(int I = 0;I strlen(str);i ) {
if(*(str I)= ' '){
if (is_word == 1) {
不锈钢:
*(tmp j)= ' \ 0 ';
* pStr =(char *)malloc(strlen(tmp)* sizeof(char));
strcpy (*pStr,tmp);//调试到这行的时候出错了。
pStr
j = 0;
}
is _ word = 0;
}否则{
if (is_word == 0) {
数数;
}
*(tmp j)= *(str I);
j;
is _ word = 1;
if (i == strlen (str) - 1)
转到ss;
}
}
返回计数;
}
最后更新于 2023-10-08 15:10:30 并被添加「」标签,已有 位童鞋阅读过。
本站使用「署名 4.0 国际」创作共享协议,可自由转载、引用,但需署名作者且注明文章出处
相关文章