在这个状态下,你看不到完整的信息,只能看到一些破碎的笔画和凌乱的线条。
但只要你懂得“展开”的规则,只要你小心翼翼地把它抚平,所有的信息都会原封不动地复现,一个“字节”都不会少。
这就是“高维拓扑流形”。
纸张,这样一个二维的流形,被折叠进了三维的空间,变成了一个纸球。
余弦感觉自己呼吸急促了起来,他想到了那天在咖啡馆里,温晓对着他说的话:
“你知道人脑有多复杂吗?千亿级的神经元,实时动态变化的生物电化学反应。要把这些东西向量化,哪怕是现在最强大的计算机,也存不下一个人完整的数据。”
“计算机里,文字能转化为向量,是因为文字本就是离散的符号,是有限的。但人,人是连续的,是混沌的。如果你要强行把一个人‘向量化’,那就意味着你要丢掉99。99%的信息,只保留几个干巴巴的标签,那样的话,我们就变成跟游戏里的NPC一样了。”
存不下。
这是当时温晓给出的,基于现有计算机科学逻辑的死刑判决。
因为在目前的线性存储逻辑里,要把一个人完整的“数字化和向量化”,需要的数据量是天文数字,是现在的硬件根本无法承载的。
但是。。。。。。
如果父母的思路,从一开始就不是“压缩”呢?
余弦死死盯着论文上的那句话,一股寒意顺着脊背袭上心头。
从信息论的角度来看,通常的数据压缩,是有“损耗”的,就像是苏老先生在读书分享会上提到的,把一张RAW高清格式的图片,压缩成JPG,信息被丢弃了,画质下降了,那是为了节省空间而做出的妥协。
但父母论文里提出来的“映射和存储”,可能从根本上,就不是这种逻辑。
他们不想丢掉那99。99%的信息。
他们想做的,是一种。。。。。。“折叠”。
就像是把这张A4纸揉成球一样。
他们是不是想通过某种手段,把一个人庞大、复杂、浩如烟海的记忆、情感、性格数据,全部“揉”在一起,折叠进一个更高维度的数学模型里?
在低维视角,比如我们现在的现实世界或者计算机世界里看来,那个被处理后的东西,可能只是一个很小的“数据包”,一个简单的“向量”,甚至只是一个坐标点。
就像这个纸球,在远处看,也只是一个白点而已。
但实际上,那个小小的“点”里,却折叠着一个完整的灵魂,一段完整的人生。
当需要的时候,只要有合适的“解压工具”,或者说,只要提供一个能够让它“展开”的空间。
这张纸就能被重新铺平。
这个被折叠的“灵魂”,就能在瞬间被“释放”出来。
那些被折叠起来的记忆、感情、性格,就会重新显现出来。
完好无损,鲜活如初。
“存储。。。。。。”
余弦喃喃自语,头皮发麻。
这个猜想太大胆、太疯狂了。
如果这是真的,那意味着,父母当年研究的,根本不是什么大模型向量化。
他们是在研究一种。。。。。。
“灵魂容器”的制作方法。
这哪里是科学论文?这分明是一本关于如何把活人装进缸子里的说明书。
“余弦?你没事吧?”
杨依依从电脑屏幕后面探出头,有些担忧地看着他。
“你。。。。。。是哪里不舒服吗?要不要休息休息?”
“没。。。。。。没事。”
他没有把这个猜想告诉杨依依。