## 核心功能 ### 1. 成交量序列分析 (volume_price_sequence.py) - 按累计成交量排序的价格趋势分析 - 三合一综合图表:价格序列+成交量分布+时间序列 - 关键价格水平自动标注 ### 2. 成交量分布深度分析 (volume_distribution_analysis.py) - 7种专业可视化图表 - 统计特征分析和分布拟合 - 交易模式识别和业务洞察 ### 3. 大额订单分析工具集 (large_orders/) - 买1/卖1量大单分析 (阈值99) - 买卖挂单合计分析 (阈值200) - 当前成交量分析 (阈值150) - 信号抑制优化算法 (38%抑制率) ## 技术特性 - 信号抑制算法:有效减少重复信号干扰 - 多维度分析:支持多种信号类型 - 专业可视化:四宫格综合分析图 - 业务洞察:基于数据的交易建议 ## 分析结果 - 卖1量大单:短期下跌,长期大幅上涨反转 - 买挂合计:各时间窗口小幅正收益 - 信号抑制:短期收益从-0.0778提升至+0.1347 🤖 Generated with [Claude Code](https://claude.com/claude-code) Co-Authored-By: Claude <noreply@anthropic.com>
438 lines
15 KiB
Markdown
438 lines
15 KiB
Markdown
# AU2512期货成交量-成交价序列分析工具
|
||
|
||
[](https://python.org)
|
||
[](LICENSE)
|
||
[]()
|
||
|
||
一个专业完整的期货数据分析工具集。通过创新的**成交量序列分析方法**和**多维可视化技术**,提供从价格趋势到成交量分布的全方位分析解决方案,为期货交易者提供深入的市场洞察。
|
||
|
||
## 🎯 核心优势
|
||
|
||
### 🔄 创新分析方法
|
||
- **按成交量排序** - 相比传统时间序列,更符合交易实际
|
||
- **业务相关性高** - 直接反映交易行为对价格的影响
|
||
- **高解释力** - 清晰展示价格随交易推进的演变轨迹
|
||
|
||
### 📊 专业可视化工具集
|
||
|
||
#### 1. 价格序列分析 (volume_price_sequence.py)
|
||
- **主图**: 成交价序列图(简洁无干扰的价格轨迹)
|
||
- **侧图**: 成交量在价格上的分布图(0.02间隔)
|
||
- **下图**: 当前成交量时间序列图
|
||
- **关键价格标注**: 成交量最大的10个价格水平(虚线+双向标注)
|
||
|
||
#### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
|
||
- **7种专业图表**: 直方图、箱线图、累积分布函数等
|
||
- **统计摘要**: 完整的分布特征分析
|
||
- **交易模式识别**: 大单分析、分组统计
|
||
- **业务洞察**: 市场活跃度和机构参与度分析
|
||
|
||
#### 3. 成交量价格分布图 (volume_price_distribution.py)
|
||
- **单一专注**: 成交量在价格上的分布
|
||
- **前20排行**: 成交量最大的价格区间列表
|
||
- **精确分析**: 0.02价格间隔的详细分布
|
||
- **快速洞察**: 立即识别热门价格水平
|
||
|
||
## 🚀 快速开始
|
||
|
||
### 安装依赖
|
||
```bash
|
||
pip install pandas numpy matplotlib
|
||
```
|
||
|
||
### 基本使用
|
||
```bash
|
||
# 1. 价格序列分析(综合图表,推荐)
|
||
python volume_price_sequence.py
|
||
|
||
# 2. 成交量分布深度分析(7种专业图表)
|
||
python volume_distribution_analysis.py
|
||
|
||
# 3. 简化成交量价格分布图(快速分析)
|
||
python volume_price_distribution.py
|
||
|
||
# 4. 分析其他数据文件
|
||
python volume_price_sequence.py data/jm2509_20250709.csv
|
||
python volume_distribution_analysis.py data/jm2509_20250709.csv
|
||
python volume_price_distribution.py data/jm2509_20250710.csv
|
||
|
||
# 5. 查看帮助信息
|
||
python volume_price_sequence.py --help
|
||
python volume_distribution_analysis.py --help
|
||
python volume_price_distribution.py --help
|
||
```
|
||
|
||
### 系统要求
|
||
- Python 3.7+
|
||
- pandas, numpy, matplotlib, scipy
|
||
- 支持中文字体的环境
|
||
|
||
## 📈 输出示例
|
||
|
||
### 生成的图表
|
||
|
||
#### 1. 综合价格序列分析图 (推荐)
|
||
 - **1.0MB**
|
||
**三合一综合分析图表**:
|
||
- **主图**: 成交价序列图(简洁清晰,无技术指标干扰)
|
||
- **侧图**: 成交量在价格上的分布(0.02间隔,水平柱状图)
|
||
- **下图**: 当前成交量时间序列图(交易活跃度变化)
|
||
- **关键价格标注**: 成交量最大的10个价格水平(浅绿色虚线+双向标注)
|
||
|
||
#### 2. 成交量分布深度分析图
|
||
 - **1.1MB**
|
||
**7种专业分析图表**:
|
||
- 直方图 + 概率密度拟合
|
||
- 箱线图(分位数分布)
|
||
- 累积分布函数
|
||
- 成交量时间序列
|
||
- 成交量分组柱状图
|
||
- 成交量贡献度条形图
|
||
- 统计摘要表
|
||
|
||
#### 3. 简化成交量价格分布图
|
||
 - **0.3MB**
|
||
**专注单一分析**:
|
||
- 成交量在价格上的分布(0.02间隔)
|
||
- 前20个成交量最大价格区间列表
|
||
- 关键统计信息标注
|
||
|
||
### 分析报告示例
|
||
|
||
#### 综合价格序列分析报告
|
||
```
|
||
开始AU2512期货成交量-成交价序列分析...
|
||
数据加载成功: 66,596 条记录
|
||
|
||
=== 数据分析 ===
|
||
数据概况:
|
||
累计成交量: 893,404 手
|
||
价格区间: 901.84 - 928.88
|
||
平均价格: 914.54
|
||
|
||
关键成交量节点:
|
||
起始: 成交量 320 手, 价格 904.76
|
||
25%: 成交量 273,254 手, 价格 911.94
|
||
50%: 成交量 527,232 手, 价格 909.18
|
||
75%: 成交量 724,868 手, 价格 921.62
|
||
结束: 成交量 893,404 手, 价格 927.48
|
||
|
||
综合价格序列图已保存: au2512_volume_price_sequence.png
|
||
|
||
【业务洞察】
|
||
1. 价格随成交量变化的完整轨迹清晰可见
|
||
2. 整体趋势: 上涨 (+2.51%)
|
||
3. 交易过程中价格呈现逐步上涨趋势
|
||
4. 关键价格水平与成交量分布密切关联
|
||
```
|
||
|
||
#### 成交量分布深度分析报告
|
||
```
|
||
开始AU2512期货当前成交量分布分析...
|
||
数据加载成功: 66,596 条记录
|
||
|
||
=== 基础统计分析 ===
|
||
平均成交量: 14.96 手
|
||
中位数成交量: 10.00 手
|
||
成交量标准差: 17.07 手
|
||
分布偏度: 2.939 (严重右偏)
|
||
|
||
=== 成交量模式分析 ===
|
||
大单交易定义: > 34.0 手 (90%分位数)
|
||
大单交易次数: 5,681
|
||
大单交易占比: 9.71%
|
||
大单成交量占比: 36.40%
|
||
|
||
成交量分组统计:
|
||
2-5手: 16,887 次 (28.9%) | 成交量: 49,572 手 (5.7%)
|
||
6-10手: 16,355 次 (27.9%) | 成交量: 126,216 手 (14.4%)
|
||
11-20手: 12,558 次 (21.5%) | 成交量: 191,344 手 (21.9%)
|
||
21-50手: 10,201 次 (17.4%) | 成交量: 321,680 手 (36.8%) 【主力】
|
||
|
||
【业务洞察】
|
||
1. 成交量分布呈现严重的右偏特征,小单交易为主,大单影响显著
|
||
2. 成交量波动较大,存在明显的活跃期和沉寂期
|
||
3. 大单交易占比较为重要,对市场流动性有显著影响
|
||
4. 21-50手交易是市场主力,贡献36.8%成交量
|
||
5. 市场活跃度适中,交易较为频繁
|
||
```
|
||
|
||
#### 成交量价格分布报告
|
||
```
|
||
开始AU2512期货成交量价格分布分析...
|
||
数据加载成功: 66,596 条记录
|
||
|
||
【前20个成交最大的价格区间】
|
||
排名 价格区间 成交量 占比 累计占比
|
||
-----------------------------------------------------------------
|
||
1 922.00-922.02 4,044 0.5% 0.5%
|
||
2 921.90-921.92 2,678 0.3% 0.8%
|
||
3 907.70-907.72 2,460 0.3% 1.0%
|
||
4 908.00-908.02 2,434 0.3% 1.3%
|
||
5 927.00-927.02 2,332 0.3% 1.6%
|
||
...
|
||
|
||
分析完成!
|
||
```
|
||
|
||
## 💡 为什么选择成交量序列分析?
|
||
|
||
| 特性 | 传统时间序列 | 成交量序列 |
|
||
|------|-------------|------------|
|
||
| **解释力** | ⭐⭐ | ⭐⭐⭐⭐⭐ |
|
||
| **业务相关性** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
|
||
| **趋势识别** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
|
||
| **决策价值** | ⭐⭐ | ⭐⭐⭐⭐⭐ |
|
||
|
||
### 传统方法的局限性
|
||
- ❌ 无法展示交易过程对价格的真实影响
|
||
- ❌ 时间间隔不均等,影响趋势判断
|
||
- ❌ 难以识别关键交易时点的价格变化
|
||
|
||
### 成交量序列的优势
|
||
- ✅ 清晰展示价格随交易推进的演变轨迹
|
||
- ✅ 便于识别不同交易阶段的价格水平
|
||
- ✅ 可以量化成交量对价格的影响
|
||
- ✅ 更符合期货交易的实际业务逻辑
|
||
|
||
## 📁 项目结构
|
||
|
||
```
|
||
jm_ces/
|
||
├── 📊 核心分析脚本
|
||
│ ├── volume_price_sequence.py # 综合价格序列分析 (22KB)
|
||
│ ├── volume_distribution_analysis.py # 成交量分布深度分析 (23KB)
|
||
│ └── volume_price_distribution.py # 简化成交量价格分布 (16KB)
|
||
│
|
||
├── 📈 生成的图表
|
||
│ ├── au2512_volume_price_sequence.png # 综合价格序列图 (1.0MB)
|
||
│ ├── au2512_volume_distribution_analysis.png # 成交量分布分析图 (1.1MB)
|
||
│ └── au2512_volume_price_distribution.png # 简化价格分布图 (0.3MB)
|
||
│
|
||
├── 📄 文档文件
|
||
│ ├── README.md # 项目说明文档
|
||
│ └── CLAUDE.md # Claude指导文档
|
||
│
|
||
└── 📂 数据目录
|
||
├── au2512_20251013.parquet # 增强后的数据(含当前成交量列)
|
||
├── au2512_20251013_backup.parquet # 原始数据备份
|
||
└── jm2509_*.csv # 其他期货数据文件
|
||
```
|
||
|
||
## 🗄️ 数据格式
|
||
|
||
### 支持的文件格式
|
||
- **Parquet文件** (推荐): `.parquet`
|
||
- **CSV文件**: `.csv`
|
||
|
||
### 必需字段
|
||
```
|
||
UTC, UTC.1, 时间, 累积成交量, 成交价, 成交额,
|
||
买1价, 卖1价, 买1量, 卖1量,
|
||
买2价, 卖2价, 买2量, 卖2量,
|
||
买3价, 卖3价, 买3量, 卖3量,
|
||
买4价, 卖4价, 买4量, 卖4量,
|
||
买5价, 卖5价, 买5量, 卖5量
|
||
```
|
||
|
||
### 关键字段说明
|
||
- `UTC`, `UTC.1`: UTC时间戳(毫秒级)
|
||
- `时间`: 当日累计时间(格式:MM:SS.秒)
|
||
- `成交价`: 最新成交价格
|
||
- `累积成交量`: 当日累计成交量
|
||
- `当前成交量`: 单笔成交量(由累计成交量差值计算)
|
||
- `数列号`: 按累计成交量排序的序号
|
||
- `买1价`~`买5价`: 买方五档价格
|
||
- `卖1价`~`卖5价`: 卖方五档价格
|
||
|
||
### 数据增强功能
|
||
- ✅ 自动计算当前成交量(累计成交量差值)
|
||
- ✅ 自动生成按成交量排序的数列号
|
||
- ✅ 支持原始数据和增强数据的无缝切换
|
||
|
||
## 🎯 应用场景
|
||
|
||
### 交易分析
|
||
- 快速识别价格在交易过程中的主要趋势
|
||
- 发现影响价格变化的重要成交量时点
|
||
- 评估不同交易阶段的价格行为
|
||
|
||
### 风险控制
|
||
- 通过价格波动区间评估风险水平
|
||
- 识别价格异常变化的临界点
|
||
- 制定基于成交量的风险管理策略
|
||
|
||
### 策略研究
|
||
- 为交易策略提供量化的数据支持
|
||
- 研究成交量对价格影响的历史规律
|
||
- 优化基于成交量变化的交易时机
|
||
|
||
### 市场研究
|
||
- 理解交易行为对价格的影响机制
|
||
- 研究价格发现的动态过程
|
||
- 分析市场微观结构特征
|
||
- 识别机构投资者交易模式
|
||
|
||
## 🔧 技术特性
|
||
|
||
- **高分辨率输出**: 300 DPI高清图表
|
||
- **智能字体检测**: 自动适配中文字体
|
||
- **容错处理**: 完善的错误处理和用户提示
|
||
- **灵活配置**: 支持命令行参数自定义
|
||
- **详细分析**: 完整的统计报告和业务洞察
|
||
- **数据增强**: 自动计算当前成交量和排序
|
||
|
||
## 🚀 核心功能亮点
|
||
|
||
### 🎯 创新分析方式
|
||
- **成交量序列分析**: 按累计成交量排序,更符合交易实际
|
||
- **关键价格标注**: 自动识别成交量最大的价格水平
|
||
- **多维度可视化**: 价格趋势 + 成交量分布的综合展示
|
||
- **精确价格间隔**: 0.02元标准间隔,符合期货市场特性
|
||
|
||
### 📊 三大分析工具对比
|
||
|
||
| 特性 | 综合序列分析 | 深度分布分析 | 简化分布图 |
|
||
|------|----------------|----------------|------------|
|
||
| **适用场景** | 日常综合分析 | 深度研究报告 | 快速价格扫描 |
|
||
| **图表复杂度** | 高(三合一) | 最高(7种图表) | 低(单一图表) |
|
||
| **分析深度** | 价格趋势+成交量 | 统计+模式识别 | 价格分布 |
|
||
| **输出文件大小** | 1.0MB | 1.1MB | 0.3MB |
|
||
| **推荐使用** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
|
||
|
||
### 🎨 视觉设计特点
|
||
- **关键价格标注**: 浅绿色虚线标识重要价格水平
|
||
- **双向标注**: 左侧显示价格,右侧显示成交量
|
||
- **价格对齐**: 主图与侧图完美同步
|
||
- **简洁清晰**: 移除技术指标干扰,专注原始数据
|
||
|
||
### 1. 价格序列分析 (volume_price_sequence.py)
|
||
#### 数据处理
|
||
- 自动检测并处理不同格式的数据文件
|
||
- 按累计成交量升序排列
|
||
- 计算关键成交量节点
|
||
- 生成移动平均线和波动区间
|
||
|
||
#### 可视化
|
||
- **成交价序列线**(蓝色主线):价格随成交量变化轨迹
|
||
- **当前成交量柱状图**:下方显示交易活跃度分布
|
||
- **移动平均线**(红色粗线):平滑价格趋势
|
||
- **价格波动区间**(红色阴影):不确定性范围
|
||
- **关键节点标注**:详细价格信息
|
||
- **分析结论框**:统计摘要
|
||
|
||
#### 统计分析
|
||
- 基础价格统计(最高、最低、平均)
|
||
- 成交量分析(分布、变化率)
|
||
- 关键节点影响分析
|
||
- 数据质量检查
|
||
|
||
### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
|
||
#### 分布统计分析
|
||
- 基础统计(均值、中位数、标准差、分位数)
|
||
- 分布特征分析(偏度、峰度、变异系数)
|
||
- 正态性检验和分布拟合
|
||
- 异常值检测和处理
|
||
|
||
#### 交易模式分析
|
||
- 大单交易识别和分析
|
||
- 成交量分组统计(1手、2-5手、6-10手等)
|
||
- 交易频率和成交量贡献度分析
|
||
- 主力交易模式识别
|
||
|
||
#### 7种专业可视化
|
||
- **直方图 + 概率密度拟合**:分布形态分析
|
||
- **箱线图**:分位数分布和数据离散程度
|
||
- **累积分布函数**:概率累积情况
|
||
- **成交量时间序列**:交易活跃度变化
|
||
- **成交量分组柱状图**:各分组交易笔数对比
|
||
- **成交量贡献度条形图**:各分组成交量占比
|
||
- **统计摘要表**:完整的统计信息展示
|
||
|
||
#### 业务洞察
|
||
- 成交量分布特征解读
|
||
- 市场活跃度评估
|
||
- 机构参与度分析
|
||
- 交易建议和风险提示
|
||
|
||
## 🛠️ 开发信息
|
||
|
||
### 依赖项
|
||
- `pandas` - 数据处理和分析
|
||
- `numpy` - 数值计算
|
||
- `matplotlib` - 数据可视化
|
||
- `scipy` - 统计分析和分布拟合
|
||
- `seaborn` - 高级统计图表(可选)
|
||
|
||
### 代码质量
|
||
- 面向对象设计,易于维护和扩展
|
||
- 完整的错误处理和用户友好提示
|
||
- 详细的代码注释和文档
|
||
- 符合Python编码规范
|
||
|
||
## 🚀 快速导航
|
||
|
||
### 新手推荐流程
|
||
```bash
|
||
# 1. 先运行价格序列分析,了解整体价格趋势
|
||
python volume_price_sequence.py
|
||
|
||
# 2. 再运行成交量分布分析,深入了解交易模式
|
||
python volume_distribution_analysis.py
|
||
|
||
# 3. 查看生成的图表和报告
|
||
# - au2512_volume_price_sequence.png
|
||
# - au2512_volume_distribution_analysis.png
|
||
```
|
||
|
||
### 数据文件准备
|
||
```bash
|
||
# 确保数据文件存在且格式正确
|
||
ls -la data/au2512_20251013.parquet
|
||
|
||
# 如果需要处理新数据,确保包含必要字段
|
||
# UTC, 累积成交量, 成交价, 等...
|
||
```
|
||
|
||
## 📞 支持与反馈
|
||
|
||
### 问题报告
|
||
如果在使用过程中遇到问题:
|
||
1. **检查数据文件格式**:确保包含必需字段(累积成交量、成交价等)
|
||
2. **确认依赖库安装**:`pip install pandas numpy matplotlib scipy`
|
||
3. **查看错误信息**:命令行会显示详细的错误提示
|
||
4. **中文字体问题**:确保系统支持中文字体显示
|
||
|
||
### 常见问题解决
|
||
- **字体显示异常**:脚本会自动检测并设置合适的中文字体
|
||
- **数据加载失败**:检查文件路径和文件格式
|
||
- **图表生成失败**:确保有足够的磁盘空间和写入权限
|
||
|
||
### 功能建议
|
||
欢迎提出改进建议和新功能需求,包括:
|
||
- 新的图表类型
|
||
- 更多的统计指标
|
||
- 更好的数据预处理
|
||
- 性能优化建议
|
||
|
||
## 📄 许可证
|
||
|
||
本项目采用 MIT 许可证,详见 LICENSE 文件。
|
||
|
||
## 🙏 致谢
|
||
|
||
感谢所有为期货数据分析和可视化做出贡献的开发者和研究人员,以及提供宝贵反馈的用户。
|
||
|
||
---
|
||
|
||
**版本**: 2.0
|
||
**最后更新**: 2025-11-02
|
||
**核心工具**:
|
||
- `volume_price_sequence.py` - 价格序列分析
|
||
- `volume_distribution_analysis.py` - 成交量分布深度分析
|
||
**项目状态**: ✅ 活跃维护中
|
||
**新增功能**:
|
||
- ✅ 成交量分布深度分析
|
||
- ✅ 当前成交量柱状图
|
||
- ✅ 7种专业可视化图表
|
||
- ✅ 业务洞察和交易建议 |