NLP主要研究领域-网络科学与数据挖掘实验室

NLP主要研究领域

时间：2024-03-14 点击数量：

信息提取：从指定文本范围中提取出重要信息，例如时间、地点、人物、事件等，可以帮人们节省大量时间成本，且效率更高。比如文摘生成利用计算机自动从原始文献中摘取文字，成果能够完整准确反映出文献的中心内容。

文本生成：根据限定条件或输入内容的不同，进行数据到文本或文本到文本的生成。

智能问答：对一个自然语言表达的问题进行某种程度的分析（例如实体链接、关系式、形成逻辑表达式等），分析完毕后在知识库中查找可能的候选答案，通过排序机智找出最佳的答案进行回复。比如电商行业中广泛应用的自动回复客服，通过回复许多基本而重复的问题，从而过滤掉大量重复问题，使得人工客服能够更好地服务客户。

机器翻译：通过把输入的源语言文本通过自动翻译获得另一种语言的文本，是自然语言处理中最为人所熟知的场景，比如百度翻译、Google翻译等。

文本挖掘：包括文本聚类、分类、情感分析以及对挖掘的信息和知识通过可视化、交互式界面进行表达。

舆论分析：通过收集和处理海量信息，对网络舆情进行自动化的分析，帮助分析哪些话题是目前的热点，同时对热点的传播路径及发展趋势进行分析判断，以实现及时应对网络舆情。

知识图谱：又称科学知识图谱，在图书情报界称为知识域可视化或知识领域映射地图，是显示知识发展进程与结构关系的一系列各种不同的图形。以可视化技术为载体来描述知识资源及其载体，挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。