也不要粗暴地直接把线性方法扔进废纸篓。虽然线性方法的拟合效果比较差,但是在有限的数据量下他们的结论是足够可靠的,而且可解释性也远远好于神经网络。
传统线性模型不应该被抛弃的原因:可解释性。社会科学的一个重要目的,是要去理解,去说明,我们所关心社会现象背后的机理。只有理解了一个社会问题的成因才有可能去对症下药解决它。
而神经网络这类的复杂模型,虽然说在一些场景下有很好的预测作用,却由于其黑箱性很难给研究者带来什么新的见解。什么叫黑箱呢,就是说一个东西你完全不知道他的机理是什么。神经网络简直是为这个词量身定做的例子。
对于社会现象的形成,对于社科学者而言,会觉得很复杂,但对神经网络而言,材料根本不够塞牙缝,所谓的大模型根本跑不起来,这时候,还是需要线性分析来起作用了。可以通过系数看出哪几个因素是和社会问题的产生相关性最强,或者你使用pca之类更复杂一些的线性模型可以看出一些更有意思的现象:比如说一些因素无法单独对结果产生影响,需要合在一起才行。
(一只小猫咪@知乎)