OpenAI 2月16日凌晨发布了文生视频大模型Sora,这是一个能够根据文本指令或静态图像生成长达1分钟视频的扩散模型,而且视频中还包含精细复杂的场景、生动的角色表情以及复杂的镜头运动——相比于其他视频生成模型,Sora 在生成时长、连贯性等方面都有显著的优势。
在训练中,Sora应用了Diffusion-Transformer技术作为基础,将视频打包成一个个连续的时空包(patch),结合语言与视频应对的报幕员系统,通过大量视频素材训练使其能力远超对手。在这一过程中,视频生成涌现出了三维一致性和极强的连贯性等能力。
马斯克对这一新模型评论道:人类应该认赌服输,但AI增强的人类将创造出最好作品。
2024年2月16日,谷歌发布其大模型矩阵的最新力作——Gemini 1.5,并将上下文窗口长度扩展到100万个tokens。这意味着Gemini 1.5 Pro可一次处理大量的信息——包括1小时的视频、11小时的音频、超过3万行代码或超过70万字的代码库。
Gemini 1.5 Pro达到了与1.0 Ultra相当的质量,同时使用了更少的计算。它能对不同的模式执行高度复杂的理解和推理任务,包括视频。例如,当给定巴斯特·基顿44分钟的无声电影时,该模型可以准确地分析各种情节点和事件,甚至可以推理出电影中容易被遗漏的小细节。
Gemini 1.5 Pro还展示了令人印象深刻的“情境学习”技能,可以从长时间提示的信息中学习新技能,而无需额外的微调。
英伟达推出了自家版本的ChatGPT,Chat With RTX。它并非是在网页或APP中运行,而是需要下载安装到个人电脑中。这让它不仅是在运行效果上更快,也意味着Chat With RTX在聊天内容上或许并没有那么多限制。除此之外,Chat With RTX另一个亮点功能,就是可以根据在线视频做回答。
它背后所依靠的仍是两款开源LLM,即Mistral和Llama 2,用户在运行的时候可以根据喜好自行选择。
OpenAI已完成一轮员工售股交易,使其估值飙升至800亿美元以上。在短短不到10个月内,这家人工智能初创企业估值增长了近两倍。
OpenAI此次售股交易由风险投资公司Thrive Capital牵头,采取要约收购的形式进行。这意味着员工可以将手中的公司股份变现,而无需通过传统的融资方式为公司运营筹集资金。
软银公司CEO孙正义寻求筹资1000亿美元,创立一家人工智能芯片企业,与英伟达展开竞争,并希望该公司在业务上能与ARM互补。
孙正义的这个芯片项目标志着他的下一个重大举措,尽管当前软银尚处大幅削减创业投资之际。如果成功,这将是自ChatGPT问世以来,人工智能领域最大的一笔投资,远超微软公司对OpenAI的超过100亿美元投资。
孙正义的这一人工智能芯片企业项目代号为Izanagi。孙正义直接领导该项目。Izanagi是日本神话中的创造和生命之神。
人工智能初创公司OpenAI首席执行官山姆·奥特曼(Sam Altman)正在积极争取美国政府的支持,以推动一家大规模合资企业的成立。
据彭博社上月报道,他的目标是筹集数十亿美元资金,以大幅提升全球尖端计算芯片的产能,从而避免他担忧的人工智能大规模部署和该领域持续发展的潜在障碍。
一位不愿透露姓名的知情人士透露,奥特曼认为在合资企业的审批、时间安排及结构方面,与美国政府的紧密合作至关重要。该知情人士表示,这位首席执行官已会见了美国商务部长吉娜·雷蒙多(Gina Raimondo),并正努力安排与其他官员的会面。美国商务部官员已就OpenAI雄心勃勃的中东计划进行了内部讨论。
截至2月16日美股收盘,英伟达市值达到1.8万亿美元,以微弱优势超过Alphabet和亚马逊,成为全球市值第四高的公司,仅次于微软、苹果和沙特阿美。
就在AI浪潮兴起前的2022年10月,英伟达市值还不到3000亿美元,远远落后于亚马逊和Alphabet当时超过1万亿美元的市值。在聊天机器人ChatGPT横空出世点燃AI浪潮后,市场对英伟达AI芯片的需求激增。英伟达股价去年上涨了两倍有余,然而该公司堪称疯狂的涨势远未结束。2024年刚进入第二个月,英伟达股价今年迄今为止已上涨了近50%,市值增加了约6000亿美元,超过了它在2023年最后七个月的市值增幅。
2月13日,Arm股价上涨29%。自 2 月 8 日公布季度财务数据以来,Arm 股价已累计上涨 93%,但周一上涨的具体原因尚不明确。自 9 月份首次公开募股以来,Arm 股价几乎翻了三倍,周一收于 148.97 美元,市值接近 1530 亿美元,仅比英特尔市值低 300 多亿美元。
上周,Arm 表示其最新指令集的授权费用可以提高一倍家居设计工作室,该指令集占公司 15% 的专利使用费收入。这表明 Arm 可以扩大其利润率,并从新芯片中赚取更多利润。该公司还表示,由于人工智能的需求,其正在开拓云服务器和汽车等新市场。
春节期间,各位科技圈大佬也都不约而同地送上新春祝福,包括特斯拉 CEO 马斯克、微软联合创始人比尔・盖茨和苹果 CEO 库克。
比尔・盖茨通过微博晒出了自己使用毛笔书写福字的视频,为中国朋友送上龙年祝福,配文称“这是我第一次尝试写福字。虽然还有很大进步空间,但它表达了我对中国朋友的祝福。龙年快乐!”
库克也在官微发文送上祝福,“愿大家新年快乐 / Wishing everyone joy in the New Year!”并且附上吕末拍摄的春节短片,由 iPhone 手机摄制。并在 X 平台发文:祝世界各地庆祝农历新年的人们新年快乐!恭祝大家龙年大吉。
马斯克在微博和自家的 X 平台晒出贺岁海报:包含了 S3XY 四个字母、特斯拉汽车的书法“龙”字,并配文“龙年大吉 The Year of the Dragon”。
华为常务董事、终端 BG CEO、智能汽车解决方案 BU 董事长余承东今年驾驶问界M9回安徽六安霍邱老家过年途中因安全驾驶问题引发争议。
2月12日,余承东在朋友圈晒出了自己从安徽老家驾车返回深圳的经历。余承东中间一次手长时间离开方向盘,被罚一次三分钟(不允许使用智能驾驶功能),后又被罚了一次导致智能驾驶无法使用。他表示自己从出家门开始就全程一路智能驾驶,“完全没有事干,很轻松啊”。但“唯一不爽的地方”,是手指头还要搭在方向盘上,因为法规要求,不允许长时间离手。
同济大学汽车学院教授、博导朱西产表示,我国的量产车型普遍处于L2级辅助驾驶阶段,部分品牌销售会以L2+级别宣传自己的产品。基于我国复杂的道路交通情况,针对L2辅助驾驶级别的技术仍要手托方向盘才可以进行。
Meta 公司首席执行官马克・扎克伯格(Mark Zuckerberg)日前发布视频,罗列了 9 条因素,得出的结论是售价 500 美元的 Quest 3 头显不仅比 3500 美元的苹果 Vision Pro 更物有所值,而且产品体验更好。
扎克伯格这段“王婆卖瓜,自卖自夸”的视频在上传后,出现了巨大争议,并将这段视频对比史蒂夫・鲍尔默(Steve Ballmer)嘲讽 iPhone 事件。
扎克伯格2月16日接受《晨酿日报》播客采访时,扎克伯格解释了他发布这段视频的原因,认为部分媒体先入为主地认定 Vision Pro 是比 Quest 3 更好的产品:我看到媒体的报道都是这样的:“Vision Pro 是苹果公司的产品,它是如此昂贵的产品,所以它一定是质量更好的产品,尽管很多人都在说,嘿,不,你应该去买 Quest 3,因为它的价格更优惠”。我想要说的是,这东西贵七倍并不意味着它就更好。如果你逐个使用案例来分析,Quest 3 的表现真的很不错。我为我们所做的工作感到自豪。所以,我只是想把这一点说出来。
2月14日,AI大牛Andrej Karpathy官宣了一条重要消息:他已经从OpenAI离职家居设计工作室,不过这中间没有什么戏剧性冲突,他只是想去尝试一下自己的个人项目。
Karpathy在官宣离职的推文中写道,「是的,我昨天离开了OpenAI。首先,没发生什么特别的事情,这不是由于任何特定事件、问题或者争议导致的(但请继续提供阴谋论,因为它们确实很有趣 :))。实际上,在过去的大约一年时间里,在OpenAI的经历真的很棒——团队非常强大,人们非常棒,路线图也非常令人兴奋,我认为我们都有很多可以期待的。我的近期计划是致力于我的个人项目,看看会发生什么。那些关注我一段时间的人可能会对此有所了解。」