百川智能发布Baichuan 3:超越GPT-4的中文大语言模型新星
1月29日消息,近日,由前搜狗公司CEO王小川创立的百川智能宣布推出了一款超千亿参数的大语言模型——Baichuan 3。据称,该模型在多项中文任务评测中表现优异,甚至在某些方面超越了GPT-4。
在逻辑推理能力的测试中,Baichuan 3展现出了强大的实力。无论是在MCMLE、MedExam还是CMExam等医疗领域的评测上,其中文效果均超过了GPT-4,被誉为“中文医疗任务表现最佳的大模型”。这一突破性的进展,无疑为中文医疗信息处理领域注入了新的活力。
据本站了解,为了训练出如此强大的模型,百川智能团队在Baichuan 3的训练过程中采用了多种创新技术手段和方案。其中包括“动态数据选择”、“重要度保持”以及“异步CheckPoint存储”等,这些技术的运用不仅保证了训练的稳定性,还大大缩短了故障恢复时间,据悉,故障恢复可在10分钟内完成。
除了在技术层面的突破,Baichuan 3还在语义理解和生成能力上进行了进一步的提升。通过“迭代式强化学习”技术,该模型在诗词创作方面展现出了惊人的实力。无论是五言律诗、七言绝句,还是“沁园春”、“定风波”等高难度的宋词文体,Baichuan 3都能生成工整对仗、韵脚和谐的作品,让每个人都能体验到诗词创作的乐趣。
百川智能作为一家成立不到一年的公司,能够在如此短的时间内推出这样一款领先的大语言模型,实属不易。目前,Baichuan 3大模型已经正式上线,并在百川智能官网上提供了试用服务。相信在不久的将来,这款模型将会在更多领域发挥出其强大的实力。 |