注册
登录
新闻
头条号
新浪财经APP
宏观经济
A股
港股
美股
基金
理财
黄金
期货
能源
互联网金融
房地产
更多
外汇
管理
消费
科技
互联网
手机
保险
数码
科普
创业
银行
新三板
其他
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:实测提升明显
几张图总结Llama3相比较前两代的模型的升级:单模型训练成本近千万
MistralAI正式官宣开源全球最大的混合专家大模型Mixtral 8x22B
Qwen1.5系列再次更新:阿里巴巴开源320亿参数Qwen1.5-32B模型
重磅!阿里开源自家首个MoE大模型:Qwen1.5-MoE,性能=70亿参数模型
大模型企业宫斗连续剧:StabilityAI CEO辞职,HF CEO说考虑收购
最新消息显示OpenAI可能还在训练GPT-5,可能在今年年中发布GPT-5
600G显存才能拉起来的Grok-1不太惊艳!马斯克开源大模型Grok-1!
重磅!谷歌开源Gemini同源技术大模型Gemma,同等规模评测对比优秀
OpenAI Sora视频的特点有哪些?与Runway、Pika区别是什么?缺点是啥
第二代Qwen大模型发布,阿里巴巴一口气开源了30个不同参数规模的模型
GPT-5可能是什么样?网友总结了Sam在达沃斯论坛中的几场演讲
DeepSeekAI开源国产第一个混合专家技术的大模型:DeepSeekMoE-16B
如何解决大模型微调的知识遗忘?香港大学提出微调新范式和LLaMA Pro
Google前AI研究人员认为2024年可能不会出现能与GPT-4竞争的开源模型
DataLearnerAI
关注人工智能和促进生活美好的技术
热点新闻
量子之歌并购Letsvan后首发力作 熊猫款WAKUKU两小时售罄
亲历者讲述缅甸震后一夜:多人受伤失联,救援急需大型机械设备
速腾聚创邱纯潮谈人形机器人:定位是做供应链企业,已开发出超级传感器
国泰君安去年营收净利双增长,机构及交易业务收入增逾43%
丹麦外交大臣回应万斯登格陵兰岛言论:不喜欢这种语气,这不是对盟友说话的方式
四大发电央企2024年净赚240亿,业绩表现为何分化
2025年电动汽车百人会,雷军、王传福、李想、李斌、何小鹏都来了
去年四季度加仓信立泰、华海药业,中欧基金葛兰:科技创新、消费复苏是核心关注方向
申万宏源去年营收增长超15%,投行业务收入降逾27%
视频|“深交所·创享荟” 聚焦AI赋能千行百业
阿里开源截止目前为止参数规模最大的Qwen1.5-110B模型:实测提升明显
几张图总结Llama3相比较前两代的模型的升级:单模型训练成本近千万
MistralAI正式官宣开源全球最大的混合专家大模型Mixtral 8x22B
Qwen1.5系列再次更新:阿里巴巴开源320亿参数Qwen1.5-32B模型
重磅!阿里开源自家首个MoE大模型:Qwen1.5-MoE,性能=70亿参数模型
大模型企业宫斗连续剧:StabilityAI CEO辞职,HF CEO说考虑收购
最新消息显示OpenAI可能还在训练GPT-5,可能在今年年中发布GPT-5
600G显存才能拉起来的Grok-1不太惊艳!马斯克开源大模型Grok-1!
重磅!谷歌开源Gemini同源技术大模型Gemma,同等规模评测对比优秀
OpenAI Sora视频的特点有哪些?与Runway、Pika区别是什么?缺点是啥
第二代Qwen大模型发布,阿里巴巴一口气开源了30个不同参数规模的模型
GPT-5可能是什么样?网友总结了Sam在达沃斯论坛中的几场演讲
DeepSeekAI开源国产第一个混合专家技术的大模型:DeepSeekMoE-16B
如何解决大模型微调的知识遗忘?香港大学提出微调新范式和LLaMA Pro
Google前AI研究人员认为2024年可能不会出现能与GPT-4竞争的开源模型
1
2
3
4
5
更多自媒体作者