转自:扬子晚报网
随着人工智能(AI)大模型火爆全网,内容生成形态已然发生了颠覆性的变革,一些挑战与风险也随之而来。近日一份网络微报告称,“AI技术进步在提升生产效率的同时,也带来了信息过载严重、模型偏见加剧、逻辑自证陷阱等风险”。
大模型的幻觉简而言之,就是有可能“胡说八道”。 而面对AI幻觉,训练数据是影响大模型“认知能力”的关键要素,如何避免AI大模型产生“幻觉”,业内有最优解吗?不少科技行业、企业和专家也在频频出招应对,比如近日上线的“大模型加速器 2.0”就恶意从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。而合合信息(212.160, -3.98, -1.84%)携手赛尔教育,将文档单页处理耗时降低了超30%,等等。

上海一位人工智能算法专家告诉记者,要减少大模型“幻觉”,训练数据的广度、深度和质量都至关重要。为了能有效避免AI大模型生成错误结果、产生“幻觉”,从技术实现角度首先需要大力避免偏见和错误信息的引入,甚至建立行业共享的“幻觉”黑名单库。同时要持续改进模型结构、监控和更新模型,甚至可以进行AI对抗检测,训练专门的模型来检测大模型生成的虚假内容利用AI技术识别AI生成的文本、图像等等。
大模型需要不断“吸收”正确的专业知识,才能应对实际应用问题。相关技术人员告诉记者,在处理年报、论文、实验室报告等专业文档的过程中,一个符号的解析失误,便可能“误导”大模型,得出与事实相悖的结论。可信性的缺失,也制约了大模型在实际应用场景中的纵深拓展。而经过技术人员的开发应对,现在经过技术升级,大模型可精准识别上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,解析稳定率达99.99%,单页处理耗时较行业可比产品降低超30%;还能“逆还原”十余种专业图表数据,并将其转化为大模型可理解的结构化数据。
赛尔教育CTO杨林介绍说,教育行业中所涉及的文档格式多样,在内容上也包含了表格、公式、手写字符、多语言文字等信息。如何高效准确地提取各类文档中的文本信息,并非易事。“教育行业的大模型建设工作中,数据的数量和质量起着决定性作用。我们做了很多尝试,模型的速度和准确性都达不到要求,严重影响科研工作的进展。”杨林表示,行业知识库的构建基于大量文档的文本信息提取,需要更加高效率、高准确率的工具。而“大模型加速器”提升了对复杂版面、元素的“理解力”,使其按照人类正常的阅读顺序识别文档结构,智能划分标题、段落、表格和图表等内容块,帮助大模型理解版面、内容间的对应关系,减少AI“幻觉”。

近期,多家券商机构也纷纷宣布接入大模型,帮助分析师、行业研究员等专业人士提高工作效率。技术人员介绍说,知识库可以通过在“投喂”给知识库的Markdown及JSON文件中标记页码、坐标等空间位置信息,实现对句子、段落的精确溯源,为使用者快速检验。比如大模型在多份高达上千页的财报文件中找到收入、利润等关键数据后,券商分析师可利用溯源功能定位原表格,对信息进行复核,防止错误、遗漏。

最后技术专家也建议,防止大模型出现幻觉,除了需要采取各种技术手段和AI监控,还需要相应的制度协同,比如创建白名单知识库等等。
扬子晚报/紫牛新闻记者 徐晓风
校对 郭凤


APP专享直播
热门推荐
冲击全球第四!《哪吒2》票房破154亿元,已在比利时上映!苹果CEO库克:我是忠实观众 收起冲击全球第四!《哪吒2》票房破154亿元,已在比利时上映!苹果CEO库克:我是忠实观众
- 2025年03月29日
- 09:33
- APP专享
- 扒圈小记
32,550
生双胞胎17岁代孕女孩已嫁人 知情人称17岁代孕女孩有生育史
- 2025年03月27日
- 11:21
- APP专享
- 扒圈小记
20,527
点赞致敬!护士说地震时护住宝宝是本能反应
- 2025年03月29日
- 04:57
- APP专享
- 北京时间
10,038

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)
投资研报 扫码订阅
股市直播
-
趋势领涨今天 07:15:50
调查报道《起底“医保取现”背后“回流药”销售网》播出后,国家卫生健康委相关负责人表示,按照《医疗机构药事管理规定》要求,医疗机构必须制订本机构药品采购工作流程;建立健全药品成本核算和账务管理制度;严格执行药品购入检查、验收制度;不得购入和使用不符合规定的药品。国家卫生健康委对此类违法行为保持“零容忍”态度,将协同医保、药监等部门,责成武汉等地压实属地责任,加强对医疗机构穿透式监管,持续严厉打击违法违规行为,切实保障人民群众健康权益。 -
趋势领涨今天 04:23:50
【飞天价格继续下跌 25年飞天茅台原箱批价报2165元/瓶】今日酒价披露的批发参考价显示,3月29日,25年飞天茅台原箱较前一日下跌5元,报2165元/瓶;24年飞天茅台原箱较前一日下跌10元,报2190元/瓶。 -
趋势领涨今天 03:50:20
美的集团(sz000333):拟50亿元-100亿元回购股份 其中70%及以上回购股份将用于注销美的集团(sz000333)公告称,拟50亿元-100亿元回购股份,资金来源为自有资金及/或股票回购专项贷款。回购价格不超过100元/股,回购股份将用于注销以减少注册资本及实施股权激励计划及/或员工持股计划,其中70%及以上回购股份将用于注销并减少注册资本。 -
趋势领涨今天 00:57:40
三、中航产融(sh600705):拟以股东大会决议方式主动撤回A股股票上市交易中航产融(sh600705)公告称,公司收到控股股东中航工业的函件,公司拟以股东大会决议方式主动撤回A股股票在上海证券交易所的上市交易。公司股票于2025年3月31日开市起复牌。前有玉龙股份(sh601028),现在有中航产融(sh600705)主动退市,并且给出现金选择权,这些都是良心公司,至少不忽悠现在持股的散户,至于当初怎么上市的,或者有没有造假,那就是后话了,所以,现有的公司如果增加一条主动退市,不给处罚,对净化市场环境不一定是坏事。四、美股大跌,中概股回调美股低开低走,三大指数均大幅收跌,纳指跌2.7%,本周累跌2.59%;标普500指数跌1.97%,本周累跌1.53%;道指跌1.69%,本周累跌0.96%。彭博科技七巨头指数收跌3.5%。大型科技股普跌,奈飞、谷歌、亚马逊、Meta跌超4%,特斯拉、微软、英特尔跌超3%,苹果跌逾2%,英伟达跌超1%。美股大跌的主要原因,一是老美挑战全世界,二是美国2月核心PCE物价指数环比增0.4%、同比增2.8%,均超预期。中概股也下跌超过3%,但中概股复制的是白天港股的走势,富时A50出现了小幅回调,说明市场还有抛压,下周开盘大盘要回踩60日线附近,随后有望启动上行,大家安心过周末吧,至少下周利空出尽。 -
趋势领涨今天 00:57:36
二是2015至2019年期间,东旭集团虚增收入累计478.25亿元,虚增利润累计130.01亿元,虚增货币资金447.9亿元(最高);东旭光电虚增收入累计167.6亿元,虚增利润累计56.27亿元。三是东旭集团及相关主体非经营性占用东旭光电、东旭蓝天货币资金,截至目前披露的尚未归还金额合计169.59亿元。河北、深圳证监局拟对李兆廷等43名责任主体合计罚款17亿元,19名主要责任人员采取五年以上直至终身证券市场禁入措施。东旭光电已经退市,证监会对东旭光电和母公司东旭集团开出罚单,意义重大,意味着对财务造假、市场操纵等上市公司,绝不允许一退了之,该罚就罚,该抓就抓,对相关公司都有一定的震慑作用,重点是罚的钱能赔给散户吗?散户能索赔吗? -
趋势领涨今天 00:57:31
昨天又是大家打酱油的一天,大盘量能继续大幅萎缩,两市只有927只个股红盘,超过4200只个股等待红盘,很多个股几分钟没有一笔交易,有交易的都是量化在收割,盘中急速拉升,随后快速回落,然后再也没有高点,这就是量化的手段,所以,如果你不能在拉升中撤离,最终只有坐电梯。不过,有个好现象就是大盘还没有完全破位,下面60日线还有较强的支撑,只要大盘不跌破60日线,就谈不上本轮行情结束,所以,让子D先飞一会吧,或许黎明就在眼前!另外,所有的靴子下周都将落地,市场或许迎来拨云见日,都担心的利空不一定是利空,所以,大家还是再忍忍吧!一、证监会:禁止参与IPO战略配售的投资者在承诺的限售期内出借股份证监会发布证券发行管理办法,一是禁止参与IPO战略配售的投资者在承诺的限售期内出借股份;二是增加银行理财产品、保险资产管理产品作为IPO优先配售对象。这是晚间实实在在的利好,限售股在限售期内出借出去砸盘,这本身就不叫限售,现在禁止出借,对市场当然是利好,至少减少了抛压。不过,真正的做空工具还有量化和期指交割,如果再把量化规范限制一下,把期指交割延长一点,我们相信A股一定能走出牛市!二、证监会拟对东旭集团证券违法行为行政处罚:对43名责任主体合计罚款17亿元经查,一是2017年东旭光电不符合股票发行条件,以欺骗手段骗取发行核准,违法募集资金75.65亿元;2018年东旭集团不符合公司债券发行条件,以欺骗手段骗取发行核准,违法募集资金35亿元。 -
趋势领涨2025-03-28 10:26:55
阿尔特(sz300825)(300825.SZ)公告称,公司与日产(中国)投资有限公司签署了《业务主协议》,双方将以汽车产品相关车型的开发为目标,在整车开发委托、汽车零部件和系统的开发等领域积极开展项目合作。该协议为合作框架性文件,具体业务合作将以另行协商签署的协议为准。协议有效期为6年。公司是行业领先的提供独立整车研发及系统解决方案的前瞻技术驱动型企业,能够为客户提供全流程、全领域、全栈式、短周期的“交钥匙”服务。日产汽车在中国市场深耕多年,开发了多款经典畅销车型。本次协议签署有利于公司业务拓展和稳健经营,提高公司在国际客户群体中影响力和全球范围内的品牌知名度。 -
数字江恩2025-03-28 09:18:43
2-c是否跌破3340不能保证,只能当下确认。下周几个需要确认的事情是:首先,如果跌破3297,则代表结构判断错误,反之,不跌破都将完成第2浪回踩,然后开始第3浪上涨。其次,下周一二内突破3406代表向上扩展,直接确认第3浪开始,这是小概率事件;正常来说,下周一二震荡,则下周二之后,站上图上的蓝色轮峰线,即确认第三浪开始。判断条件都给出了,下周大家可以结合条件,自己当下判断第2浪下跌结束、第3浪上涨开始。 -
数字江恩2025-03-28 09:18:38
5分钟图来看3297上涨的内部次级别结构。其中第1浪上涨内不是abc三段式结构,第2浪回踩也同样是abc三段式结构。其中2-c的主要跌幅已经在本周五完成。【更多独家重磅股市观点请点击】 -
数字江恩2025-03-28 09:18:25
首先看15分钟图,这是大盘去年12月3494以来的总体结构。对3140的反弹结构,提前预测了abc+X+12345的内部形态。这里我们已经看到3297开始新的1浪上涨结束,而上周高点3439开始的第2浪回踩将在下周确认结束,这是下周最重要的事情。【更多独家重磅股市观点请点击】