首页 排行 分类 完本 书单 专题 用户中心 原创专区
起点中文网 > 科幻 > 科研系学霸 > 第28章 曾经的自己

科研系学霸 第28章 曾经的自己

作者:我是躺赢狗 分类:科幻 更新时间:2025-11-03 12:48:56 来源:笔趣岛

第(1/3)页

周五,周昀和汇金的人正式签订了预研项目合同,只要预研项目能够达到预期标准,那接下来就是真正的大项目。

双方通过一周的时间,沟通了需求还有汇金需要提供的资源。

汇金的需求很简单,之前就已经谈的差不多了,现在只是更加明确一点,

他们需要的是一个能够预测某只单一股票的模型,消耗资源要尽可能少,准确率要尽可能高,这也是后续他们为周昀提供多少支持的重要依据。

至于资源方面,财大气粗的汇金提供了64张H100的显卡集群,还有相互配套的处理器和内存,其价值已经超过了千万。

因为说是预研项目,但其实除了在数据量和模型架构上有所阉割之外,现在要做的版本和最终版本在最核心的东西上是差不多的。

毕竟只要能精准预测一支股票,就能精准预测无数支,两者之间无非就是数据量上的差别。

汇金显然知道其中的难度,所以才会这么大方。

在周昀的预估中,这些资源应该是绰绰有余的,因为他研究的模型在算力的消耗上本就比市面上的同类型模型要低。

汇金还支付了周昀一个月两万的劳务费,按照合同,他需要在一年之内完成预研项目,如果失败了,他就要加入汇金。

按理来说,这种大项目,这样的验收时间并不算富裕,不过周昀有信心一年之内搞定。

实验室里,周昀并没有第一时间就开始设计方案,反倒是开始看起了论文。

因为不管是前世还是现在,他接触的都是“小模型”,这里的小模型指的是LSTM、CNN、FCN这种结构单一,参数量不大的轻量级神经网络。

而他现在要做的项目则需要用到真正意义上的多模态大模型,这种大模型现在普遍都是基于Transformer架构,

虽然Transformer非常厉害,但是也有一个缺点,因为他的主要核心Attention也就是注意力机制,

这种算法的时间复杂度复杂度是O(n^2),所以需要的计算量非常大,这也是为什么现在市面上的大模型训练需要的显卡都是几千几万张。

大模型和小模型之间除了算力消耗和成本上有着巨大差异,在整体架构上也有着明显的差异。

第(1/3)页

目录
设置
设置
阅读主题
字体风格
雅黑 宋体 楷书 卡通
字体风格
适中 偏大 超大
保存设置
恢复默认
手机
手机阅读
扫码获取链接,使用浏览器打开
书架同步,随时随地,手机阅读
收藏
换源
听书
听书
发声
男声 女生 逍遥 软萌
语速
适中 超快
音量
适中
开始播放
推荐
反馈
章节报错
当前章节
报错内容
提交
加入收藏 < 上一章 章节列表 下一章 > 错误举报