华人团队开源新模型U-Cast,像「放大镜+过滤器」一样,从上万条时间序列里秒抓关键层级,预测更快更准;同步发布十领域真实大数据集Time-HD,供全球研究者免费练手,推动高维时序预测进入「ImageNet时刻」。
从金融市场的上千支股票,到智慧城市交通网络的上万个传感器,我们正全面进入一个由高维时间序列数据驱动的时代。
然而,当前主流的时间序列预测(TSF)模型,大多仍停留在仅包含几个或几百个变量的低维环境中进行评估(Table 1)。

当面对成千上万个变量构成的高维复杂系统时(Time-HD),则往往在效率与性能上表现出明显的局限性。
此外,大规模数据集已被证明是多个研究领域取得突破的关键支撑。
例如,CV中的ImageNet、MS COCO,NLP中的GLUE、SQuAD,以及Graph中的OGB,都在推动相应领域的发展中发挥了决定性作用。
然而,在时序预测领域,始终缺乏同类的大规模基准,这使得研究进展受到制约。
进一步地,高维环境才能真正释放通道依赖型模型的价值。
而在现有的低维数据集上,通道依赖型(Channel-Dependent, CD)模型相较通道独立型(Channel-Independent, CI)模型并未表现出稳定且显著的优势。
这一现象容易引发怀疑,即显式建模通道间关系是否真的有效?
之前有研究提出是维度数量本身限制了CD方法潜在优势的发挥。


通过理论分析(Theorem 1 and 2),他们证明了在高维环境下,当存在非冗余变量时,CD模型的贝叶斯风险(Bayes risk)始终低于CI模型,且这一优势会随着维度增加而不断扩大。