信息提取:从指定文本范围中提取出重要信息,例如时间、地点、人物、事件等,可以帮人们节省大量时间成本,且效率更高。比如文摘生成利用计算机自动从原始文献中摘取文字,成果能够完整准确反映出文献的中心内容。
文本生成:根据限定条件或输入内容的不同,进行数据到文本或文本到文本的生成。
智能问答:对一个自然语言表达的问题进行某种程度的分析(例如实体链接、关系式、形成逻辑表达式等),分析完毕后在知识库中查找可能的候选答案,通过排序机智找出最佳的答案进行回复。比如电商行业中广泛应用的自动回复客服,通过回复许多基本而重复的问题,从而过滤掉大量重复问题,使得人工客服能够更好地服务客户。
机器翻译:通过把输入的源语言文本通过自动翻译获得另一种语言的文本,是自然语言处理中最为人所熟知的场景,比如百度翻译、Google翻译等。
文本挖掘:包括文本聚类、分类、情感分析以及对挖掘的信息和知识通过可视化、交互式界面进行表达。
舆论分析:通过收集和处理海量信息,对网络舆情进行自动化的分析,帮助分析哪些话题是目前的热点,同时对热点的传播路径及发展趋势进行分析判断,以实现及时应对网络舆情。
知识图谱:又称科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形。以可视化技术为载体来描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。