手机浏览器扫描二维码访问
这让一心想要走在算法技术最前沿倍感压力。
虽然以他和老黄以及英伟达的关系,可以通过诸多方式绕开此禁令。
可不论如何,这都称得上是巨大的困扰。
倍感无奈的孟繁岐开始向内寻求算法突破,以期待能够降低自己对显卡设备的需求。
可原本孟繁岐比较看好的两个技术方向,都没有取得预期的成功。
其一,孟繁岐很早就意识到,早期深度学习模型大多依赖于FP32(32位浮点数)的高精度计算,虽然结果准确,但计算量和存储需求巨大。
根据前世的经验,孟繁岐早早就推动了FP16(16位浮点数)训练和推理。
这种格式可以节约一半的计算资源,虽然会稍稍影响模型的性能,但在针对性的优化下几乎可以忽略不计,这也是前世的主流训练模式。
如今,被计算设备所限制的孟繁岐被迫探索准确度更差的FP8(8位浮点数)。
前世的通识是,该模式计算效率极高,但精度损失更大,适用范围非常有限。
往往是在训练完成之后,进行FP8的格式转换,以节约模型的推理使用成本。
直接在训练的时候采用这种格式是从未被证实过的。
为此,黄仁勋甚至在显卡的硬件设计上对FP8提供了一定的优化可支持,但半年的时间过去了,孟繁岐并没有看到自己预期的效果。
另一方面上,孟繁岐同时在寻求“稀疏”
这一概念。
这一条技术路线开启得更早,(见368-369章)。
毕竟他很早就知晓,随着AI技术的发展,两个超级大国之间势必会因为世界地位的争夺而脱钩。
一旦形成对抗,硬件设备无疑将会被限制封锁。
可若要孟繁岐从根本上助力中国的硬件发展......他却也没有那个本事。
能做的,唯有投资点钱罢了。
国内的芯片技术,显然不可能跳过几代的制程,直接赶上英伟达。
换句话说,孟繁岐清楚国内硬件厂商所能提供的算力必然不如英伟达,这才提议了模型“稀疏”
这一概念,以求节省资源。
模型稀疏与神经网络一样,都是对大脑行为的模仿。
从生物角度上说,大脑中的神经元连接并非全连接,而是高度稀疏的。
每个神经元只与少数其他神经元相连,这种稀疏性使得大脑能够在低能耗下高效处理信息。
这给了大脑极高的能量效率,大脑在极低的能耗下完成复杂任务,部分得益于其稀疏的连接方式。
人体的总功耗才70-300w,其中大脑才仅仅只有15-30w。
显卡动辄就300-500w,却完全无法与人脑的能力相比拟。
孟繁岐认为这是对计算资源的极大浪费,也已经取得了一定的成果证明稀疏方向的概念,可以在不怎么影响性能的情况下成倍地减少计算消耗。
但这件事情,却又被硬件的发展大大减缓了。
传统硬件常年来仅仅只针对密集计算优化,难以高效处理稀疏数据。
孟繁岐开发并证明技术的可行性,仅仅只用了两个多月的时间,可想要硬件良好支持,批量生产,不再等个一年,却是不大可能。
正在这AI领域逐渐陷入沉寂,总是只有小修小补的时刻,DeepSeek-R1的发布像是巨石入水,掀起了巨浪。
而令孟繁岐极为懊恼的事情是,DeepSeek取得巨大成功所依赖的技术方向,竟与他本人设想相差无几。
刘峰被师父扫地出门后,遭遇了人生最大的不幸被女神欺负了!在被女神再三的戏弄后彻底的人品大爆。既然娶不了白富美,那就睡白富美的小妈,既然当不了高富帅,那就变身级白脸男,将各路美女玩弄于鼓掌之间!斗高官戏富豪争名利左妻右妾万花丛中夜夜笙歌。当云开雾散尘埃落定时,当刘峰身价亿万站在都市最巅峰时,沐阳暮然回,却才恍然大悟灯火阑珊处春意正浓!本站为书迷更新美女总裁的神医保镖最新章节,查看坐怀不滥所撰都市言情美女总裁的神医保镖的最新章节免费在线阅读。...
周先生,我们注意到您小时候曾经涉猎过篮球乒乓球羽毛球围棋跳棋五子棋中国象棋国际象棋书法绘画吉他音乐等多方面的领域,那这是否意味着就算您当初不选择足球做您的职业,您在其他领域也一样可以取得如今的成功?这个嘛只有在足球上,我才有远不止三分钟的热度。所以之前我们列举的那些都只是您三分钟...
服务女病人,帮助女护士,这就是张辉的专业按摩护理。按摩结束,没有其他服务,工作期间,我可是正经的男护士...
作者初三狮子的经典小说她从宇宙星河来最新章节全文阅读服务本站更新及时无弹窗广告小说他在废墟碰见她时,她握着尘灰看它们随风而逝,抬眸间清亮的眼睛,比那轮红日更加耀眼在球场时,她自顾自的玩着星光与月光,就像她所在世界,无任何喧嚣他从楼顶路过时,她在看星星,可她眼睛里的光辉,比天上星光还令人着迷在被人围攻时,她卸了几双胳膊,下一秒却立刻睡着...
七年的痴心,换来的不过是一场无情的大火!七年后他再次见她,已是另一番景象。见他来了,她呵呵一笑,夜总,你瞧瞧,人家要把我塑造成一个恶毒女人呢。...
据说她是被李氏买来给儿子冲喜的,却在新婚之夜克死丈夫!丈夫死后,还莫名其妙的有了身孕!啧啧,名声不好,却有一张祸水脸,引来不少男人的觊觎!没关系,咱上辈子是杀手,咱不怕!...