DeepSeek 的走红,如统一颗迸发,出庞大能量,霎时了中国的 AI 星系。正在上海人工智能的群星中,稀宇科技(MiniMax)是颇为亮眼的那一颗。
DeepSeek 以文字见长,MiniMax 则正在文本、视频、语音多模态手艺范畴连结领先。MiniMax 旗下海螺 AI 视频网坐全球拜候量位居榜首。截至 2 月上旬,MiniMax 以每日生成数百万条视频占领全球第一宝座,每日生成语音量位居国内前二,文本处置量也位居国内前列。正在全世界合作最激烈的范畴,这家上海公司若何一步步提拔合作位次,正在细分赛道超越顶尖同业?
用人工智能生成视频,是很多人乐于测验考试的使用。但 AI 的手艺缺陷也引来良多吐槽:“上一段视频中生成的是张三,下一段视频就变成了另一张脸。无论怎样调整,都无法让两段视频的配角变成统一人。”人物脚色分歧性的难题,让 AI 难以制做出统一人物脚色、分歧故工作节的短片,大大了 AI 生成视频的使用场景。曲到本年 1 月 MiniMax 发布最新视频模子,将这一难题完全化解。用户只需供给 1 张人物的反面照片,非论生成几多段气概悬殊的视频,配角都是这小我。这让网友惊呼,一张照片就能做片子,这不是梦!正在创业过程中,MiniMax 一直手艺驱动。动态视频中若何连结人物面部多角度的实正在度和不变性,若何连结人物脚色高度分歧…… 痛点就是 MiniMax 攻关的沉点。开辟团队进行了大量手艺摸索,比选分歧的手艺径,最初开辟出 S2V 模子 —— 只需保守方案 1% 的输入量和计较成本,“上传 1 张图片”的结果就脚够好。正在 3 年多时间里,一次次迭代升级,文生视频、图生视频、从体参考等功能持续优化。这些立异,让海螺 AI 视频正在激烈合作中杀出沉围,利用量反超 OpenAI 的 Sora,用户分布正在全球超 200 个国度和地域。正在文生语音等功能上,MiniMax 也走出了差同化线。网友发觉,MiniMax 的语音功能竟然带无情绪调理和结果器功能,AI 生成的语音能够带上高兴、忧伤、生气等情感,这一立异让有声书和剧的出产力大幅提拔。“通用人工智能不是简单的互联网流量变化,而是计较范式的式立异,将会引领出产力、社会分工以及财产布局的深刻变化。”MiniMax 创始人闫俊杰说。
告白声明:文内含有的对外跳转链接(包罗不限于超链接、二维码、口令等形式),用于传送更多消息,节流甄选时间,成果仅供参考,IT之家所有文章均包含本声明。
算力、算法和数据是人工智能成长的“铁三角”。MiniMax 创立之初,算力和数据十分无限,独一选择就是正在算法上求冲破。公司将 80% 的算力取研发资本投入底层架构研发,这正在外人看来就像一场豪赌。“我们正在工程上碰到的良多问题,源于一片漆黑的未知。”公司手艺团队正在没有成熟经验可供自创的环境下,一次次试错,持续进行试探。一年后,公司成功推出国内首个基于 MoE 架构的模子,研发人员又向“留意力机制”难题倡议冲击。本年 1 月,这是中国公司初次冲破保守 Transformer 架构,并逐步为行业普遍承认。
“底层模子能力是决定大模子使用成功取否的首要要素。”MiniMax 副总裁告诉记者,虽然照着现成的图纸盖楼相对容易,但图纸的不脚也会楼房的高度。我们选择用本人的图纸建立大厦,一起头大概慢一些,但但愿能更好应对将来的挑和。MiniMax-01 模子冲破了长文本处置瓶颈,可高效处置最长 400 万 token(词元)的上下文。正在工业范畴,该模子能够快速解析百万字设备日记,辅帮毛病诊断;正在医疗场景,它可持续患者数年病历,生成个性化医治方案。比来两年,大模子手艺快速迭代,国际国内 AI 行业都正在白热化合作。底层模子一次严沉迭代对产物带来的优化结果,会远超正在工程实现层面临产物进行“雕花”。这也是 MiniMax 一直紧盯模子本身,加快迭代升级的主要缘由。
DeepSeek 的走红,如统一颗迸发,出庞大能量,霎时了中国的 AI 星系。正在上海人工智能的群星中,稀宇科技(MiniMax)是颇为亮眼的那一颗。
DeepSeek 以文字见长,MiniMax 则正在文本、视频、语音多模态手艺范畴连结领先。MiniMax 旗下海螺 AI 视频网坐全球拜候量位居榜首。截至 2 月上旬,MiniMax 以每日生成数百万条视频占领全球第一宝座,每日生成语音量位居国内前二,文本处置量也位居国内前列。正在全世界合作最激烈的范畴,这家上海公司若何一步步提拔合作位次,正在细分赛道超越顶尖同业?
用人工智能生成视频,是很多人乐于测验考试的使用。但 AI 的手艺缺陷也引来良多吐槽:“上一段视频中生成的是张三,下一段视频就变成了另一张脸。无论怎样调整,都无法让两段视频的配角变成统一人。”人物脚色分歧性的难题,让 AI 难以制做出统一人物脚色、分歧故工作节的短片,大大了 AI 生成视频的使用场景。曲到本年 1 月 MiniMax 发布最新视频模子,将这一难题完全化解。用户只需供给 1 张人物的反面照片,非论生成几多段气概悬殊的视频,配角都是这小我。这让网友惊呼,一张照片就能做片子,这不是梦!正在创业过程中,MiniMax 一直手艺驱动。动态视频中若何连结人物面部多角度的实正在度和不变性,若何连结人物脚色高度分歧…… 痛点就是 MiniMax 攻关的沉点。开辟团队进行了大量手艺摸索,比选分歧的手艺径,最初开辟出 S2V 模子 —— 只需保守方案 1% 的输入量和计较成本,“上传 1 张图片”的结果就脚够好。正在 3 年多时间里,一次次迭代升级,文生视频、图生视频、从体参考等功能持续优化。这些立异,让海螺 AI 视频正在激烈合作中杀出沉围,利用量反超 OpenAI 的 Sora,用户分布正在全球超 200 个国度和地域。正在文生语音等功能上,MiniMax 也走出了差同化线。网友发觉,MiniMax 的语音功能竟然带无情绪调理和结果器功能,AI 生成的语音能够带上高兴、忧伤、生气等情感,这一立异让有声书和剧的出产力大幅提拔。“通用人工智能不是简单的互联网流量变化,而是计较范式的式立异,将会引领出产力、社会分工以及财产布局的深刻变化。”MiniMax 创始人闫俊杰说。
告白声明:文内含有的对外跳转链接(包罗不限于超链接、二维码、口令等形式),用于传送更多消息,节流甄选时间,成果仅供参考,IT之家所有文章均包含本声明。
算力、算法和数据是人工智能成长的“铁三角”。MiniMax 创立之初,算力和数据十分无限,独一选择就是正在算法上求冲破。公司将 80% 的算力取研发资本投入底层架构研发,这正在外人看来就像一场豪赌。“我们正在工程上碰到的良多问题,源于一片漆黑的未知。”公司手艺团队正在没有成熟经验可供自创的环境下,一次次试错,持续进行试探。一年后,公司成功推出国内首个基于 MoE 架构的模子,研发人员又向“留意力机制”难题倡议冲击。本年 1 月,这是中国公司初次冲破保守 Transformer 架构,并逐步为行业普遍承认。
“底层模子能力是决定大模子使用成功取否的首要要素。”MiniMax 副总裁告诉记者,虽然照着现成的图纸盖楼相对容易,但图纸的不脚也会楼房的高度。我们选择用本人的图纸建立大厦,一起头大概慢一些,但但愿能更好应对将来的挑和。MiniMax-01 模子冲破了长文本处置瓶颈,可高效处置最长 400 万 token(词元)的上下文。正在工业范畴,该模子能够快速解析百万字设备日记,辅帮毛病诊断;正在医疗场景,它可持续患者数年病历,生成个性化医治方案。比来两年,大模子手艺快速迭代,国际国内 AI 行业都正在白热化合作。底层模子一次严沉迭代对产物带来的优化结果,会远超正在工程实现层面临产物进行“雕花”。这也是 MiniMax 一直紧盯模子本身,加快迭代升级的主要缘由。