作 者:赵紫玉[1] 徐金安[1] 张玉洁[1] 刘江鸣 ZHAO Ziyu, XU Jin' an, ZHANG Yujie, LIU Jiangming (School of Computer and Information Technology, Beijing Jiaotong University, Beijing 100044,China) 机构地区:[1]北京交通学院计算机与信息技术大学,北京100044 出 处:《中文信息学报》2017年第6期192-200,共9页Journal of Chinese Information Processing 基 金:国家自然科学基金资助项目(61370130);科技部国际科技合作计划(K11F100010);中央高校基本科研业务费专项资金资助项目(2017JBZ2017);北京市重点学科共建资助项目(计算机运用技术);中国科大学计算技术探讨所智能信息处理重点实验室开放课题(IIP2017-4);北京交通学院人才基金资助项目(2017RC034). 摘 要:该文提出了—种基于自定义知识库强化获取规则集,以及规则与统计模型相结合的日语时间表达式识别措施.在按照Timex2标准对时间表达进行细化分类的基础上,我们结合日语时间词的特点,渐进地扩展重构日语时间表达式知识库,实现基于知识库获取的规则集的优化更新,旨在不断提高时间表达式的识别精准度.同时,融合CRF统计模型提高日语时间表达式识别的泛化能力.实验结果显示开放测试F1值达0.898 7.Based on the knowledge base we defined, this paper presents a Japanese time expression recognition method throughcombining rules setstrengthened by knowledge base with statistical model. According to the Timex2 standards' granular classification on time, we progressivelyexpanded and reconstructed the knowledge base given the Japanese time characteristic, and then achieved rules set optimization and update, in order to increase recognition accuracy. Simultaneously, we fused CRF model to enhance the generalization ability of Japanese time expression recognition. Our experimental results show that the F1 value reaches0. 8987 on open test. 关 键 词:知识库 规则集 统计模型 分 类 号:TP391[自动化与计算机技术—计算机运用技术;自动化与计算机技术—计算机科学与技术] ,日语论文,日语毕业论文 |