c语言中的中文分词

没有网上公告,需要咨询专业人士。

c语言是一种面向过程的抽象通用编程语言,广泛应用于底层开发。c语言可以用简单的方式编译处理低级内存。

c语言是一种高效的编程语言,只产生少量的机器语言,不需要任何运行环境的支持就可以运行。C语言虽然提供了很多底层处理功能,但仍然保持了跨平台的特性。用标准规范编写的c语言程序可以在许多计算机平台上编译,包括嵌入式处理器和超级计算机等操作平台。

c语言诞生于美国贝尔实验室,由丹尼斯·里奇在肯·汤普森设计的B语言基础上发展而来。它的主要设计完成后,汤普森和里奇用它彻底改写了UNIX,并且随着UNIX的发展,C语言得到了不断的完善。

为了全面推广C语言,许多专家学者和硬件厂商联合组成了C语言标准委员会,并于1989年诞生了第一个完整的C标准,缩写为“C89”或“ANSI C”。到2020年,最新的C语言标准是2018年6月发布的“C18”。

如何用C语言调用NLPIR进行中文分词 1.打开vs后,创建一个新项目,如下所示。新项目的名称是文本分割。构建完成后,一个文本分段文件夹将出现在您选择的目录中。

2.从nlpir官网下载相关资源,这里是2013版。下载地址:

3.解压下载的文件,找到Data文件夹,bin文件夹中的NLPIR.h文件,include文件夹和lib文件夹中的NLPIR.h文件。

在NLPIR.lib文件中,将这四样东西复制到刚才text-segmentation文件夹中的text-segmentation文件夹,如下所示

效果:

4.单击文本分段。SLN在文本分割文件夹下打开这个项目,将NLPIR.h文件添加到头文件中,如下所示。

5.单击项目-属性(快捷键ALT

F7),设置如下图所示。不要问我为什么这样设置,我也不懂。我摸索了很久,没有也做不到。

6.在source中创建新程序,并创建新的C源程序。

7.接下来,您可以在这里编写代码。我附上我的一段代码作为例子。最重要的是前面的函数头,可以直接复制。

#ifndef OS_LINUX

#包括

#pragma注释(lib," NLPIR.lib ")

#endif

#包括

#包括

#包括

#包括

#包括

#包含“NLPIR.h”

#包括

使用命名空间std

void IfInit();//判断是否初始化成功。

void if exit();//是否成功退出?

int main()

{

IfInit();//初始化程序

nl PIR _ SetPOSmap(ICT _ POS _ MAP _ SECOND);

int nitems//

nitems = nl PIR _ import user dict(" H:\ \ sentence \ \ user dict _ manual . txt ");

nl PIR _ SaveTheUsrDic();

cout"import "nitems "

单词“endl

//NLPIR_AddUserWord("A股");

//NLPIR_AddUserWord("上证指数");

//int I;

//char sC语言分词和显示书写功能? void输入(char *str) {

char c;

int I = 0;

while ( (c = getchar())!= '\n' i 81) {

*(str I)= c;

我;

}

}

int Split_Count (char *str,char **pStr) {

int count = 0,is_word = 0,j = 0;

char tmp[81];

for(int I = 0;I strlen(str);i ) {

if(*(str I)= ' '){

if (is_word == 1) {

不锈钢:

*(tmp j)= ' \ 0 ';

* pStr =(char *)malloc(strlen(tmp)* sizeof(char));

strcpy (*pStr,tmp);//调试到这行的时候出错了。

pStr

j = 0;

}

is _ word = 0;

}否则{

if (is_word == 0) {

数数;

}

*(tmp j)= *(str I);

j;

is _ word = 1;

if (i == strlen (str) - 1)

转到ss;

}

}

返回计数;

}

相关文章

发表新评论