模型 - 搜索 News

6 分钟

百川智能上线开源全模态模型 Omni-1.5，号称多项能力超越 GPT-4o mini

IT之家 1 月 26 日消息，百川智能今日宣布，Baichuan-Omni-1.5 开源全模态模型正式上线。该模型不仅支持文本、图像、音频和视频的全模态理解，还具备文本和音频的双模态生成能力。

来自MSN1 小时

趣丸科技钟鹏：AI辅助创作，两分钟内就能生成高质量音乐

于2024年年底召开的中央经济工作会议在部署今年重点经济发展任务时明确指出，开展“人工智能+”行动，积极运用数字技术、绿色技术改造提升传统产业。

1 小时

DeepSeek新模型“火”到海外，Meta首席AI科学家称“开源在超越闭源了”

AI业界人士已经在讨论开源的影响。Meta首席AI科学家Yann ...

2 小时on MSN

AMD：已将 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上

IT之家 1 月 25 日消息，AMD 宣布，已将新的 DeepSeek-V3 模型集成到 Instinct MI300X GPU 上，该模型经过 SGLang 强化，针对 Al 推理进行了优化。 IT之家查询发现，AMD 早在去年 12 月 26 ...

2 小时

周鸿祎谈DeepSeek：市场严重低估其技术能力和未来前景

他在视频一开始便给出判断，称中美AI竞争日益激烈，但最终中国必将胜利。谈及中国大模型公司DeepSeek最近的表现，周鸿祎用 “简直逆天”来形容，认为在对抗美国AI技术霸权的 “中国大模型技术复仇者联盟战队” 中，DeepSeek必定占有一席之地。

3 小时

太惨，一个月仅23个下载！盘点2024“理想丰满现实骨感”的大模型们！

旗舰模型 OLMo 1B 拥有 12 亿个参数、16 个层、16 个 head、隐藏层大小为 2048、上下文长度为 2048 个 token、词汇量为 50,280，面向开发者、数据科学家和企业。尽管如此，该模型在社区中仅收获了1k左右的下载。

来自MSN3 小时

Hugging Face 开源全球最小视觉语言模型

Hugging Face 公司开源了 SmolVLM-256M，这是一个参数量最少的视觉语言模型。它能在普通笔记本电脑上运行，支持多种视觉数据处理任务。该模型采用新的编码器，在多项基准测试中表现出色，展现了小型模型的巨大潜力。

21经济网4 小时

新鲜早科技丨DeepSeek低成本训练并开源“震动”Meta；小米SU7交付量已 ...

4、 Meta计划今年AI资本开支至少600亿美元。 Meta首席执行官扎克伯格表示，公司今年的资本支出将大幅增加，主要受人工智能和庞大的新数据中心推动。扎克伯格在Facebook帖子中公布了支出估算。Meta将在今年投资600亿至650亿美元用于人工智能（AI）相关的资本支出。扎克伯格写道：这将是人工智能决定性的一年。预计2025年Meta AI将成为领先的AI助手，服务超过10亿人；Llama ...

Lianhe Zaobao5 小时

《经济日报》：大模型创新不一定要依赖最先进硬件

中国初创公司深度求索（DeepSeek）发布廉价大模型，性能可比肩美国OpenAI最新模型，引起国际媒体关注。中国官媒发文，称DeepSeek的成功证明，大模型创新不一定要依赖最先进的硬件，而是可以通过聪明的工程设计和高效的训练方法实现。

5 小时

中国AI新贵DeepSeek，能否撼动OpenAI的霸主地位？

在AI领域的全球版图上，一家名为深度求索（DeepSeek）的中国企业正以其卓越的创造力引发广泛关注。近日，这家总部位于杭州的公司凭借其最新发布的推理模型R1，在欧美AI界掀起了一场不小的波澜。

腾讯网6 小时

中国大模型“搅动”硅谷，巨头恐慌，大佬发声：中国AI已追上美国

每经记者：岳楚鹏兰素英 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果