重生之AI教父 - 第258章每个人的贴身医生

病友这个群体是绝大部分人都不大熟悉的一个圈子，都说患难之交生死之交，普通人这一生着实很难有机会遇到。

也就唯有病友这个圈子是真的有难同当了。

因为遭受了同样的痛苦，他们彼此之间常会第一时间分享各种有用的信息情报。

不过这一次有些特殊，孟繁岐的网站其实还远没有到可以使用的程度，大家之所以如此关注该网站，是因为魏则西个人的经历。

他的不幸与突如其来的幸运。

想要在网络上获取关注，势必要足够极端才能够博取眼球。

而魏则西在短短几天之内的变化，可以说是从极端的不幸到极端的幸运了。

前几天的画风还是艰难求生，如今却是柳暗花明又一村了。

魏则西心怀感激之情，不遗余力地在为孟繁岐的网站做了宣传。

众病友们也非常好奇这个网站会做到什么地步，因而网站的关注度直线上升。

“他好意归好意，只是却没思考过这会给我带来怎样的压力啊。”孟繁岐微微叹气，此事传开之后，赢得了一些名声是不假，但也引得了许多病患前来求助。

别的不说，孟繁岐的围脖信息都快爆了，乌泱泱地全是期待他提供帮助的。

魏则西的经历就像是一盏明灯，指引他们找到了一种新的办法去脱离人生的泥潭。

生老病死乃是人之常事，华国十数亿人口，遭遇病痛困扰，致使家庭拮据生活困难的，当然不计其数。

以一人之力，孟繁岐如何忙得过来？

即便有那个能力，也没有那个财力，说得难听一些，也没有那个义务。

总不能把斯坦福的医院变为自家后花园吧？他孟繁岐还没有这么大的面子，这显然是做不到的。

“既然如此，往后就只能公事公办了。做慈善是好事，我可以在华成立一个医疗慈善基金会，交由专人打理，筛选患者进行救助。”孟繁岐非常清楚，此时若不及时将救助这一事宜流程化规范化，以后自己少不得有许多大麻烦。

“为何你救助了魏则西，却不救助魏则东？”

即便十年行善，只要一朝犯错，就逃离不了这种令人无语的道德绑架。

“行善还是交给专业的人，我每年固定抽出金额去做慈善，仁至义尽了。眼下我还有一件关键的事情要做，那就是将Gpt技术与这个信息网站相结合。”孟繁岐花费巨资做这个信息查询网站，当然不只是为了便民查询医疗信息所用。

收集这些信息，翻译这些文件的时候，孟繁岐亲自制定了好几套有严格标准的格式，交给这些高材生翻译时执行。

如此一来，搭建网站的同时，他也迅速获得了高质量中英文对照的医疗文本数据。

这些数据的质量极高，中英文一一对应，在收集之初就严格遵守了孟繁岐从AI技术视角下考虑的格式，自然也就非常适合Gpt和bERt技术进行训练。

可以说这一批文本数据质量之高，是前所未有的，钞能力也不是白用的。

“在网站上查询信息是前AI时代获取信息的方式了，我们做AI技术的，怎能继续使用那么古老的查询方式？”孟繁岐很清楚，即便自己尽可能地精简界面，简化病症之间的脉络结构，也一定有人查不明白。

因此孟繁岐计划直接结合大语言模型，将这一大批的高质量医疗数据通过AI的方式融会贯通。

“有了医疗Gpt问答模型，在普通的搜索之余，就更多了一个AI问答的功能，患者需要的专业知识和文化水平就更加少了，轻松就能通过对话的形式得到需要的关键医疗信息。”孟繁岐自己进入过几个新的领域学习技能，他深知刚入门时候的难点。

有时候不是没有资料没有网站查，而是开卷你都不知道抄什么好！

一大堆资料就在你手边，你却不知道应该翻第几页，即便把答案告诉你，你小子却看不明白。

这也是不少患者最为头疼的地方。

“对于一些不常见的病症，几个高大上的医学专业词汇，和英文缩写的诊疗技术，分分钟就能把人说晕了。”韩辞觉得孟繁岐的思路合理。

“无良医生如果想忽悠你，能把感冒说成【急性上呼吸道病毒性感染性疾病】，然后把解热止痛药直接称呼其学名，什么【吲哚美辛】、【对乙酰氨基酚】。”

两下就能把没有防备心的人忽悠瘸了。

“有了医疗Gpt就能杜绝这些问题，只要直接进行对话，就像聊天一样，所有人都可以轻松获取高门槛的专业知识。虽然不敢说胜过专门科目的主任医生那么厉害，但平均在所有疾病上能有个一般医生的知识水平。”这是孟繁岐根据前世的情况大致推算的。

韩辞等人对此就没有那么乐观了：“上回Gpt和bERt潜伏在聊天群内，都得专门为他们设计繁琐的回复策略，添加了诸多限制。虽然潜伏是大获成功了，可它们两个也基本上没有什么有价值有意义的发言，这样真的行吗？”

几人的担忧不无道理，给病人提供医学建议是非常严肃的事情，需要极其专业的知识储备，也要负担不小的责任。

孟繁岐也清楚，这种AI助理问答的形式，不能保证百分之一百的正确。因此在回答的最后，医疗Gpt也会提供相关页面的链接供用户复核，并提醒病人最后要遵循医嘱。

“你们还是低估Gpt和bERt的实力了。”初版的两个受限于本身的规模和数据的质量以及大小，其性能并不足够突出。

不过孟繁岐并没有停下自己的脚步，在Gpt于bERt的初版结果符合预期之后，他就已经再次扩大了规模，训练了一个更大的bERt基准模型，获取基本的语言理解能力。

数据方面更是挥斥重金，让各大名校的医学生来做中英对照，将这些资料整理成模型需要的格式。在这个新版bERt方法的基础上，专门针对这批医疗数据做调整。

“我这种奢华的资料整理方式，远比外包给印度佬越南佬的文本标注质量要高多了。”由于文本数据量太过庞大，许多科技公司的数据标注都是外包给第三世界的。

在早期，数据的质量没有那么受到重视，大家还是以量为主，并且许多公司都在这件事情上控制了成本，不舍得下血本投入。

可孟繁岐非常清楚，openAI正是依靠严格的数据质量和人工反馈的纠正方式创造了奇迹。

并且23年也有文章证明，极其优异的高质量数据可以极大地减少语言大模型对参数规模和数据规模的需求。

这也是为何，即便众人都不理解，孟繁岐也要下血本整理出这份数据。

“伱们别看我给的钱多，我的数据验收标准也是非常严格的。稍有不妥的地方，我都不会付钱。”孟繁岐当然不是冤大头，既然出了大钱，自然也是高标准严要求。

“好在只是一个医学方向，要是全品类数据，即便是你也砸不起这个钱。”这大半个月看着孟繁岐疯狂支出，韩辞是冷汗直冒。

知道你有钱，但也经不起这么花啊！

“全品类数据就不需要这么严格的把关了，医疗信息人命关天，我慎重一些并不过分。况且这也是一锤子买卖，前期基建信息多，以后持续维护需要的金额就会小非常多了。”孟繁岐看着高质量医学数据库逐渐成型，心中清楚，这款专精医疗内容问答的智能模型已经可以开始训练准备了。

“运气好的话，差不过12月能出来。”即便手握数百张泰坦，孟繁岐差不多也需要一两个月的时间才能推动这款产品投入使用，目前的落后硬件对AI的限制可见一斑。

“过几天得问问老黄了，不知道他的帕斯卡系列研究得怎么样了。”孟繁岐心中很是焦急，p100系列显卡一出，他的训练效率至少提升三四倍。

等到那时，他就可以组建自己的超算中心，后续的任何进展都是事半功倍。

投推荐票上一章章节目录下一章加入书签返回书架

第258章 每个人的贴身医生

第258章每个人的贴身医生