随着人工智能技术的发展加快,用计算机对自然语言的形、音、义等信息进行处理,实现人机之间的信息交流,提高计算机对句子的识别率,是人工智能界、计算机科学和语言学界所共同关注的课题。尽管自然语言处理已经成为人工智能的热门细分行业,但技术本身尚有不足,专利申请量不高。
在20世纪40年代至50年代,机器翻译相关技术处于理论研究阶段,这段时期并没有相关专利申请提出。
20世纪60年代开始,进入基于规则的机器翻译系统时代。相关专利开始零星地出现,积累了大量规则机器翻译系统方面的基础专利。
上世纪80年至90年,是机器翻译系统逐渐成熟并走向市场的阶段,这一时期专利申请量开始爆发,尤其是近些年来对系统算法框架的创新。深度学习带来的技术革命。
从技术发展路线来看,自然语言中词性标注分为基于规则和基于统计的两种标注技术,基于规则的词性标注的缺点是针对性太强,很难进一步升级。基于统计的词性标注也同样存在缺点和局限性,例如在建立模型参数时,需要大量训练语料,而训练语料的选择会影响到精度。于是有人提出了基于规则和统计结合的词性标注方法,弥补了单一方法对标注结果的影响,发挥了两种方法的优点。就词性标注而言,专利申请增长缓慢。
词汇级语义分析关注的是如何获取或区别词语的语义。从发展路线来看,基于实例和统计模型鲜有重要专利申请。由于关键词提取技术的发展,基于义词词典的相关技术,有相关的重点专利产生,是将来的发展重点之一。
总之,在智能技术快速发展前提下,自然语言处理相关企业和部门,应积极进行技术研发和专利保护,在人工智能与深度学习应用于自动问答系统的大环境下,把握应用方向,进行相关的专利技术布局。结合产品根号的服务于大众。