关于 Rho,Linear correlation,线性相关性的局限性讨论

2016/1/31 posted in  观点

a discussion about the limitation of linear correlation

Q:
展示图

分享个很有意思的图给大家。这上面差异迥然的两个序列,相关性竟然能达到0.97
意味着如果太依赖相关性来检测某些序列之间的关系,可能会被带到沟里去……

A:
Linear correlation......线性...线性...,上copula吧...

Q:
是的,linear,但是现在太多的产品设计和应用是基于线性的。
上copula是不是太重了?正在考虑计算机领域中的有些概念,比如hamming distance,是不是可以引入进来辅助解决这个问题

A2:
主要是线性corr的基本假设太多了。
实际情况很乏咋,很容易就不满足,所以一般这种情况用非参数检验
比如:维克森符号秩

Q:

嗯,尤其在买方,需要验证各个策略之间的相关性的时候,用这样的线性corr,会把两个pnl差异很大的情况认为高相关。很容易带到沟里。
线性的corr只要两个序列与中心均值的“趋势”程度稍微一致,就会给出高相关的结果。像图中的绿线细看的话与红线趋势勉强是一致的,中间高两边低。我试过将绿线标准化一下,就与红线基本一样了

A2:
但是总感觉,金融策略有时候不太适用一些其他数据科学领域的方法,比如一上来先进行标准化数据。因为金融策略进行数据标准化以后的经济学解释失去了意义。如果从数学上来讲,或者说马科维奇的金融风险理论,全部将收益对方差进行标准化调整,那么必然带来的问题是这些策略的风控模型无法应用了。真实世界的sigma每天都在由于外界因素在波动。标准化以后到底如何止损,锁定收益将会变得极其难以衡量。