huice/工作流.md
Your Name e5dd5b5593 feat: 期货数据分析工具集 v2.0
## 核心功能
### 1. 成交量序列分析 (volume_price_sequence.py)
- 按累计成交量排序的价格趋势分析
- 三合一综合图表:价格序列+成交量分布+时间序列
- 关键价格水平自动标注

### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
- 7种专业可视化图表
- 统计特征分析和分布拟合
- 交易模式识别和业务洞察

### 3. 大额订单分析工具集 (large_orders/)
- 买1/卖1量大单分析 (阈值99)
- 买卖挂单合计分析 (阈值200)
- 当前成交量分析 (阈值150)
- 信号抑制优化算法 (38%抑制率)

## 技术特性
- 信号抑制算法:有效减少重复信号干扰
- 多维度分析:支持多种信号类型
- 专业可视化:四宫格综合分析图
- 业务洞察:基于数据的交易建议

## 分析结果
- 卖1量大单:短期下跌,长期大幅上涨反转
- 买挂合计:各时间窗口小幅正收益
- 信号抑制:短期收益从-0.0778提升至+0.1347

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-02 15:15:53 +08:00

1.2 KiB
Raw Permalink Blame History

一个给您的推荐工作流 对于您作为专业交易员进行初步统计分析的场景,我推荐以下这个务实且高效的流程:

数据初始转换 (一次性工作)

工具: Python脚本 + Polars

流程:

读取您原始的可能是CSV或二进制格式的数据文件。

使用Polars进行所有的数据清洗、预处理和衍生计算如计算单笔成交量

将处理干净的数据按天、按品种保存为 Parquet 格式。例如data/im_20251031.parquet。这会极大压缩文件体积并为后续分析提速百倍。

探索性数据分析 (日常工作)

工具: Jupyter Lab/Notebook + Polars + NumPy + 可视化库 (Matplotlib, Seaborn, Plotly)

流程:

在Jupyter中使用Polars的scan_parquet()函数惰性加载您需要的Parquet文件。这意味着它不会立刻把数据读入内存只有在真正需要计算时才会执行能处理远超内存大小的数据。

执行您在方案中设计的所有统计分析价差、深度、OBI等。Polars的多核并行能力会让这些复杂计算飞快完成。

使用Plotly进行交互式图表绘制以便缩放和平移观察价格和指标的细节。