果麦文化:研发AI校对软件需大量且高质量的校对语料库数据

果麦文化:研发AI校对软件需大量且高质量的校对语料库数据
2024年09月20日 12:10 金融界网站

本文源自:金融界

金融界9月20日消息,有投资者在互动平台向果麦文化提问:据搜狐网报道果麦文化的AI校对王软件9月13日获得国家版权局颁发的软件著作权,此系统不仅提高了校对的准确性,亦为出版商节省了大量人力成本。果麦拥有图书出版行业独一无二的优质中文校对语料库数据,所以成功研发出版行业AI校对软件,AI校对王是出版行业唯一能商业化运用的AI校对软件。请问为何必须拥有校对语料库数据,才能研发出AI校对软件?出版行业校对语料库数据是很稀缺的资源吗?

公司回答表示:研发AI校对软件需要大量且高质量的校对语料库数据,在开发和改进校对软件的过程中,需要大量的数据来进行训练,学习其中的规律和模式;其次,校对语料库的数据需要涵盖各种不同的文本类型和领域,以确保AI校对能够在各种场景下表现良好;最后,不同的错误类型在不同的文本中出现的频率不同,模型需要在训练过程中遇到足够频次的各种错误类型,才能有效地学习和校正这些错误。因此校对语料库数据在研发AI校对软件中非常重要。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部