本文源自:金融界
金融界2024年12月2日消息,国家知识产权局信息显示,杭州安恒信息技术股份有限公司申请一项名为“一种文本数据的分类方法及装置”的专利,公开号 CN 119046738 A,申请日期为 2024 年 9 月。
专利摘要显示,本发明公开 了一种文本数据的分类 方法及装置,涉及文字 处理领域,包括获取当 前文本数据,当前文本 数据包括多个词语;对 当前文本数据中的多个 词语分别进行分词提 取;将提取后的当前文 本数据输入至分类模型 中,得到分类模型基于 当前文本数据中的词语 及预先确定的正则表达 式输出的当前文本数据 对应的类别。无需人工 对文本数据进行手动划分,而是采用分类模型进行划分,分类 模型是基于正则表达式对当前文本数据进行分类,正则表达式 包括类别对应的词语的组合,采用正则表达式判断更加准确。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有