云发教育

标题: 数据建模方法求助,这种数据结果如何组建表间关系 [打印本页]

作者: Asker    时间: 2020-9-16 06:35
标题: 数据建模方法求助,这种数据结果如何组建表间关系
自己搞了一些数据导出到txt文件,格式都是一样第一列日期时间,第二列股票代码,第三列值。
然后现在有5个txt数据我作为外部数据源连接到excel里:
1.涨停板数表:
2019/06/2460000112019/06/25600001-12019/07/1060000112019/07/1160000122019/07/1260000132019/07/1560000142019/07/02600002-12019/07/0560000212019/07/0860000222019/07/0960000232019/07/10600002-12019/07/1260000212019/07/15600002-12019/07/08600003-12019/07/1560000312019/07/1660000322019/07/1560000312019/07/166000032
第三列这里面-1代表涨停后炸板,1代表当天该股第一次涨停,2代表联系第二次涨停以此类推3、4、5。。。
然后这个表里只会显示每天有出现-1、1、2这种涨停或炸板状态的股票,意味着这个表里会每天都对应不同的多个股票,每天每个股票对应各自一种状态。对于股票来说,他的日期列的日期是不固定的但不重复的,比如当天涨停了才在该表出现,出现的话他的日期列是唯一的。意味着这个表里日期列是重复的,股票列也是重复的,但日期+股票组合在一起是不重复的唯一的 。被我说的有点绕,你们应该能看懂吧。。

2.成交额表,第三列为当天出现在1表的股 当天该股成交多少万元:
2019/06/246000011002019/06/256000012002019/07/106000013002019/07/116000011002019/07/126000012002019/07/156000012102019/07/026000022202019/07/056000022302019/07/086000022402019/07/096000022502019/07/106000022602019/07/126000022702019/07/156000022802019/07/086000032902019/07/156000033002019/07/166000033102019/07/156000033202019/07/16600003330
3.涨幅表:第三列代表第三列为当天出现在1表的股 该股第二天涨幅,但是该股如果第二天停牌的不会显示在该表里
2019/06/24600001-12019/06/2560000122019/07/106000013.52019/07/1160000142019/07/126000016.252019/07/156000017.92019/07/026000029.552019/07/056000020.22019/07/086000023.12019/07/09600002-2.42019/07/10600002-2.32019/07/12600002-3.62019/07/156000021.62019/07/08600003-6.22019/07/156000032.62019/07/16600003-8.82019/07/156000032

4.大盘成交额表:每天都会有数据,没有数据的是休市日所有股票没交易
2019/07/0899999910002019/07/0999999910022019/07/1099999910042019/07/1199999910062019/07/1299999910082019/07/1599999910105.股票名称表:记录股票代码对应的股票名称
600001股票A600002股票B600003股票C

实际处理不止这5种表,只是想表达个大概意思,另外股票个数有三四千只,数据有几百天,每只股票单独列个表感觉不现实
我现在的目的是做个图表,可以显示:
1.图表比如柱状图显示每天板数最高的股及其股票名称,用到板数表和股票名称表(1、5表)
2.切片器显示对应选定日期(或日期范围内统计)每个单独板数(或多个选定板数)总计数及对应总成交额和平均涨幅。
比如折线图上显示最近5天所有1板每天总数量及总成交额、均涨幅
3.每天不同板数之间的比较,比如-1炸板和>=1板的股票计数比较及均涨幅比较
4.每天整个市场的统计,当天大盘成交额、涨停(>=1板)数量统计、炸板(-1)数量统计、以及对应涨幅统计之类,做成每天一行数据的总览表

大概这4点吧,还有很多其他需要实现的,如果这3点能解决的话应该可以参照搞出来
我为了向达成上述目标,最近开始学powerBI pivot query这些 不过还是一知半解不知道我这个怎么处理,因为教程里多数是一对多 多对一的关系模型
我这个案例里应该算多对多,多对多的话excel里还没支持,BI里没闹明白。。
另外我这个1表板数表应该算事实表吧?应该围绕他来建立关系
还有我是想着可以把1、2、3表合并在一起(但是2、3表可能有不存在对应1表的值会被放空),这个用query不知道怎么做(用vba的话倒是会,但是考虑到刷新数据是根据这几个txt文件来处理的,所以尽量不用vba另外处理),这样合并后处理数据是不是更好一些
希望各位大大能指点下大概怎么操作。字数上限
作者: 英杰    时间: 2020-9-16 06:41
要求有点多贪心了点。。只希望有些指导性的建议,附上txt附件
(, 下载次数: 0)