崛起从金融开始_昭灵驷玉_第065章【灵境GPT-1.0语言模型】

    第(3/3)页

    “我们团队除了继续在星际2这个项目推进灵境ai之外，我们接下来的新任务就是开发构建一个语言大模型。”罗靖站在会议大屏幕右侧不急不缓地说道：

    “这个模型的核心其实就是‘自注意力机制’，也就是gpt中的t，比方说让ai给一段文字序列中的不同词语标注权重，然后对下文的推测依据权重来进行，这样做的好处就是即便之前很早的信息也能被ai用上，不至于让ai学了之后转头就忘了前面的。”

    “整个的过程是通过自监督完成，也就是ai自我学习完成，在此期间没有我们人类指导，当然也没法指导，没有人能把百渡百科、维基百科或全网的全部内容都熟记下来。”

    这时，与会的一位t5级工程师说道：“头儿，这个预训练pre-trained会不会让灵境gpt呈现出什么都懂，但样样不精通的局面？可以说全面发展反而变得全面平庸，按你之前的描述，让灵境gpt的语言模型变得更大似乎并不能使它更好的遵循用户的意图，甚至不排除会生成一些假的、有害的对人没有帮助的回答。”

    罗靖顿时说道：“好问题。所以要对灵境gpt进行微调，让它生成的答案更有帮助性，在训练阶段就不能用自监督学习的办法了，而是要找人类来给它上课。”

    此话一出，另一位工程师不禁说道：“这……那得多少人？意思是让用户来训练？那算力、维护和运营成本得爆炸，经费能撑得住吗？”

    不用想都知道前期得持续烧钱并且赚不了钱。

    罗靖淡定的说道：“经费问题那是老板该头疼的事情，我们只管搞技术和找老板伸手要钱，找老板要钱这个事情我来做就是了，你们不用管，回归正题……”

    顿了片刻，罗靖按动手里的小遥控器接着说道：“灵境gpt使用人类监督，我已经微调训练了一个初始模型，这个模型靠人类ai训练员提供对话内容。”

    众人暗暗吃惊，不愧是大佬，居然一个人就把初始模型给搞出来了。

    ……

    第(3/3)页

第065章【灵境GPT-1.0语言模型】-《崛起从金融开始》