## 核心功能 ### 1. 成交量序列分析 (volume_price_sequence.py) - 按累计成交量排序的价格趋势分析 - 三合一综合图表:价格序列+成交量分布+时间序列 - 关键价格水平自动标注 ### 2. 成交量分布深度分析 (volume_distribution_analysis.py) - 7种专业可视化图表 - 统计特征分析和分布拟合 - 交易模式识别和业务洞察 ### 3. 大额订单分析工具集 (large_orders/) - 买1/卖1量大单分析 (阈值99) - 买卖挂单合计分析 (阈值200) - 当前成交量分析 (阈值150) - 信号抑制优化算法 (38%抑制率) ## 技术特性 - 信号抑制算法:有效减少重复信号干扰 - 多维度分析:支持多种信号类型 - 专业可视化:四宫格综合分析图 - 业务洞察:基于数据的交易建议 ## 分析结果 - 卖1量大单:短期下跌,长期大幅上涨反转 - 买挂合计:各时间窗口小幅正收益 - 信号抑制:短期收益从-0.0778提升至+0.1347 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
1.2 KiB
1.2 KiB
一个给您的推荐工作流 对于您作为专业交易员进行初步统计分析的场景,我推荐以下这个务实且高效的流程:
数据初始转换 (一次性工作)
工具: Python脚本 + Polars
流程:
读取您原始的(可能是CSV或二进制格式的)数据文件。
使用Polars进行所有的数据清洗、预处理和衍生计算(如计算单笔成交量)。
将处理干净的数据按天、按品种保存为 Parquet 格式。例如,data/im_20251031.parquet。这会极大压缩文件体积并为后续分析提速百倍。
探索性数据分析 (日常工作)
工具: Jupyter Lab/Notebook + Polars + NumPy + 可视化库 (Matplotlib, Seaborn, Plotly)
流程:
在Jupyter中,使用Polars的scan_parquet()函数惰性加载您需要的Parquet文件。这意味着它不会立刻把数据读入内存,只有在真正需要计算时才会执行,能处理远超内存大小的数据。
执行您在方案中设计的所有统计分析(价差、深度、OBI等)。Polars的多核并行能力会让这些复杂计算飞快完成。
使用Plotly进行交互式图表绘制,以便缩放和平移观察价格和指标的细节。