第163章 模型初建 (3/4)
如40%)。衍生品与信用数据(期指、融资融券)代表了“聪明钱”和杠杆资金的预期,具有前瞻性,给予较高权重(25%)。舆情数据(新闻、论坛)反映了市场叙事和散户情绪,但噪音较大,且可能具有误导性,给予中等权重(20%)。调查与宏观数据(基金仓位、IPO等)频率低且滞后,但提供了机构行为的侧面印证,给予较低权重(15%)。在每个大类内部,再对具体因子进行细分赋权。例如,在交易数据中,市场广度(上涨家数比)的权重可能高于单一指数的涨跌幅。
然后,引入统计验证进行动态微调。 他利用过去几年的历史数据(回测),尝试找出在历史重要市场顶部和底部区域(这些区域的市场情绪特征相对公认,如2015年牛市顶部、2018年底部、2020年疫情底等),哪些因子的Z-Score表现最为极端和一致,哪些因子的拐点更为领先。通过这种“历史极端情绪场景下的因子表现分析”,来验证和调整初始权重。例如,他发现,在市场极度恐慌的底部,论坛恐慌关键词的爆发性增长和股指期货的深度贴水,往往比简单的涨跌家数更为敏感和领先。那么,在“恐慌维度”的合成中,这些因子的权重就可能被调高。
合成方法:
对于综合情绪指数,他将所有正向情绪因子(取正值)和负向情绪因子(取负值,因为其Z-Score高代表恐惧)的加权Z-Score进行加总,得到一个综合得分。然后,将这个综合得分映射到一个0-100的区间,或者一个类似“极度恐慌-恐慌-谨慎-中性-乐观-极度乐观”的多级刻度上。映射的阈值,同样基于历史数据的统计分位数来确定(例如,综合得分的历史前5%定义为“极度乐观”,后5%定义为“极度恐慌”)。
对于分项情绪维度指数(如乐观指数、恐慌指数、风险偏好指数、参与热度指数),则采用类似的方法,仅使用属于该维度的因子进行加权合成。
------
第四步:情绪动能与结构分析
单一的指数读数,只告诉了我们情绪的“位置”,但情绪的“变化速度”和“内部结构”可能更为关键。
• 情绪动能: 陆孤影计算综合情绪指数及分项指数的一阶差分(当日值减前一日值)作为“情绪变化速度”,计算二阶差分(速度的变化)作为“情绪加速度”。这能帮助判断情绪是“在加速升温”还是“升温速度在放缓”,是“恐慌在加剧”还是“恐慌情绪趋于稳定”。
• 情绪结构: 他设计了一个“情绪结构矩阵”,横向是四个情绪维度(乐观、亢奋、风险偏好、参与度),纵向是不同市场参与者群体(通过资金流向、论坛舆情等代理)的情绪倾向。通过对比不同维度、不同群体间的情绪差异(背离),可以发现潜在矛盾。例如,如果“乐观指数”很高(价量向好),但“风险偏好指数”很低(资金流向防御板块,期指贴水),这可能预示着上涨的基础不牢,是“虚假的繁荣”。
------
第五步:初步验证与迭代
一个初步的模型框架建立后,陆孤影并未立即投入使用。他启动了大规模的历史回测。系统加载了过去数年的全量数据,驱动着新建的“情绪维度”模型,模拟生成每一天的综合情绪指数及各分项指数。
他将模型输出的情绪指数曲线,与主要市场指数(如上证指数、创业板指)的走势图叠加。观察的重点在于:
1. 同步性: 情绪指数的波峰和波谷,是否与市场的重要顶部和底部区域基本吻合?
2. 领先性: 在关键转折点(特别是顶部和底部),情绪指数的拐点是否略微领先于价格指数?
3. 极端区域的有效性: 当模型指示“
本章未完,请点击下一页继续阅读