第15章 深奥的豆腐馅饺子 (2/5)
大多数人处于外向和内向的中间地带,是个连续变化的。
就好像在调节手机音量,是可以从0%静音,不间断的调节到100%最大音量,可以停在中间的任何一个位置。
但这篇论文提出的假设是不同的,爸爸认为,如果把观测的维度提高,人类的人格其实是由有限个“离散状态”组成的。
就像是MBTI把人分成16种,什么“骨折眉”、“快乐小狗”、“小蝴蝶”,或者大五人格分类。
当然这篇论文里的分类要复杂得多,可能要分为几千种,甚至几万种。
但无论分的再细,它依然是“离散”的。
余弦夹起一个凉透的饺子,咬了一口,豆腐馅的口感有些新奇。
“离散”,就像这碗饺子,这一只是豆腐馅,那一只是三鲜馅,另一只是猪肉馅。
它们是界限分明的类别。
你不可能吃到一个“30%猪肉馅,70%豆腐馅”的混合态饺子——
在离散的定义里,即使是混合馅,那它也会被定义成一个新的、独立的“猪肉豆腐馅”类别。
这意味着什么?
余弦还没想清楚,但父母把人的“人格特质”,当成了一种类似积木的形式,是有限的,可穷举的。
继续看论文。
第二个概念,是“向量化映射”。
这是2016年的论文,也是......父母出事的那年。
那时候,有个叫AlphaGo的围棋AI,刚刚击败了曾经的围棋世界冠军李世石,AI和“深度学习”的概念,开始出现在大众视野里。
而在现如今的2025年,“大语言模型”已经占据了整个世界,豆包、ChatGPT、Grok、Gemini、千问、元宝......都是大语言模型的代表。
余弦虽然不是研究AI方向的,但他知道,大语言模型的基石,就是把文字转化为“向量”。
也就是这个标题里的“向量化映射”。
爸爸妈妈竟然在十年前,就已经在对“向量化”做研究了?
一上午的学习,余弦还只能浅显的理解这个概念。
简单来说,就是在计算机眼里,所有的文字,都是以“坐标”的形式存在的。
拿这个领域里,一个很出名的公式来举例:
国王-男人+女人=皇后。
国王向量,减去男人特质,加上女人特质,等于皇后向量。
这个公式里的每一个词,都是可以转化为“坐标”,比如国王是[0.8, 0.6,-0.1,...],王后是[0.8, 0.9,-0.1,...]。
通过这种方式,这些文字就可以被计算了。
余弦看着碗里的饺子,脑子里也冒出了一个比喻,来帮助他理解。
&n
本章未完,请点击下一页继续阅读