上海这家公司成全球最大 AI 视频制梦者用一张照-深圳市咖沃科技有限公司

　　DeepSeek 的走红，如统一颗迸发，出庞大能量，霎时了中国的 AI 星系。正在上海人工智能的群星中，稀宇科技（MiniMax）是颇为亮眼的那一颗。

　　DeepSeek 以文字见长，MiniMax 则正在文本、视频、语音多模态手艺范畴连结领先。MiniMax 旗下海螺 AI 视频网坐全球拜候量位居榜首。截至 2 月上旬，MiniMax 以每日生成数百万条视频占领全球第一宝座，每日生成语音量位居国内前二，文本处置量也位居国内前列。正在全世界合作最激烈的范畴，这家上海公司若何一步步提拔合作位次，正在细分赛道超越顶尖同业？

　　用人工智能生成视频，是很多人乐于测验考试的使用。但 AI 的手艺缺陷也引来良多吐槽：“上一段视频中生成的是张三，下一段视频就变成了另一张脸。无论怎样调整，都无法让两段视频的配角变成统一人。”人物脚色分歧性的难题，让 AI 难以制做出统一人物脚色、分歧故工作节的短片，大大了 AI 生成视频的使用场景。曲到本年 1 月 MiniMax 发布最新视频模子，将这一难题完全化解。用户只需供给 1 张人物的反面照片，非论生成几多段气概悬殊的视频，配角都是这小我。这让网友惊呼，一张照片就能做片子，这不是梦！正在创业过程中，MiniMax 一直手艺驱动。动态视频中若何连结人物面部多角度的实正在度和不变性，若何连结人物脚色高度分歧…… 痛点就是 MiniMax 攻关的沉点。开辟团队进行了大量手艺摸索，比选分歧的手艺径，最初开辟出 S2V 模子 —— 只需保守方案 1% 的输入量和计较成本，“上传 1 张图片”的结果就脚够好。正在 3 年多时间里，一次次迭代升级，文生视频、图生视频、从体参考等功能持续优化。这些立异，让海螺 AI 视频正在激烈合作中杀出沉围，利用量反超 OpenAI 的 Sora，用户分布正在全球超 200 个国度和地域。正在文生语音等功能上，MiniMax 也走出了差同化线。网友发觉，MiniMax 的语音功能竟然带无情绪调理和结果器功能，AI 生成的语音能够带上高兴、忧伤、生气等情感，这一立异让有声书和剧的出产力大幅提拔。“通用人工智能不是简单的互联网流量变化，而是计较范式的式立异，将会引领出产力、社会分工以及财产布局的深刻变化。”MiniMax 创始人闫俊杰说。

　　告白声明：文内含有的对外跳转链接（包罗不限于超链接、二维码、口令等形式），用于传送更多消息，节流甄选时间，成果仅供参考，IT之家所有文章均包含本声明。

　　算力、算法和数据是人工智能成长的“铁三角”。MiniMax 创立之初，算力和数据十分无限，独一选择就是正在算法上求冲破。公司将 80% 的算力取研发资本投入底层架构研发，这正在外人看来就像一场豪赌。“我们正在工程上碰到的良多问题，源于一片漆黑的未知。”公司手艺团队正在没有成熟经验可供自创的环境下，一次次试错，持续进行试探。一年后，公司成功推出国内首个基于 MoE 架构的模子，研发人员又向“留意力机制”难题倡议冲击。本年 1 月，这是中国公司初次冲破保守 Transformer 架构，并逐步为行业普遍承认。

　　“底层模子能力是决定大模子使用成功取否的首要要素。”MiniMax 副总裁告诉记者，虽然照着现成的图纸盖楼相对容易，但图纸的不脚也会楼房的高度。我们选择用本人的图纸建立大厦，一起头大概慢一些，但但愿能更好应对将来的挑和。MiniMax-01 模子冲破了长文本处置瓶颈，可高效处置最长 400 万 token（词元）的上下文。正在工业范畴，该模子能够快速解析百万字设备日记，辅帮毛病诊断；正在医疗场景，它可持续患者数年病历，生成个性化医治方案。比来两年，大模子手艺快速迭代，国际国内 AI 行业都正在白热化合作。底层模子一次严沉迭代对产物带来的优化结果，会远超正在工程实现层面临产物进行“雕花”。这也是 MiniMax 一直紧盯模子本身，加快迭代升级的主要缘由。

　　DeepSeek 的走红，如统一颗迸发，出庞大能量，霎时了中国的 AI 星系。正在上海人工智能的群星中，稀宇科技（MiniMax）是颇为亮眼的那一颗。

上海这家公司成全球最大 AI 视频制梦者用一张照

发布时间:2025-04-20 18:36