huice/README.md
Your Name e5dd5b5593 feat: 期货数据分析工具集 v2.0
## 核心功能
### 1. 成交量序列分析 (volume_price_sequence.py)
- 按累计成交量排序的价格趋势分析
- 三合一综合图表:价格序列+成交量分布+时间序列
- 关键价格水平自动标注

### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
- 7种专业可视化图表
- 统计特征分析和分布拟合
- 交易模式识别和业务洞察

### 3. 大额订单分析工具集 (large_orders/)
- 买1/卖1量大单分析 (阈值99)
- 买卖挂单合计分析 (阈值200)
- 当前成交量分析 (阈值150)
- 信号抑制优化算法 (38%抑制率)

## 技术特性
- 信号抑制算法:有效减少重复信号干扰
- 多维度分析:支持多种信号类型
- 专业可视化:四宫格综合分析图
- 业务洞察:基于数据的交易建议

## 分析结果
- 卖1量大单:短期下跌,长期大幅上涨反转
- 买挂合计:各时间窗口小幅正收益
- 信号抑制:短期收益从-0.0778提升至+0.1347

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
2025-11-02 15:15:53 +08:00

438 lines
15 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# AU2512期货成交量-成交价序列分析工具
[![Python](https://img.shields.io/badge/Python-3.7+-blue.svg)](https://python.org)
[![License](https://img.shields.io/badge/License-MIT-green.svg)](LICENSE)
[![Status](https://img.shields.io/badge/Status-Active-brightgreen.svg)]()
一个专业完整的期货数据分析工具集。通过创新的**成交量序列分析方法**和**多维可视化技术**,提供从价格趋势到成交量分布的全方位分析解决方案,为期货交易者提供深入的市场洞察。
## 🎯 核心优势
### 🔄 创新分析方法
- **按成交量排序** - 相比传统时间序列,更符合交易实际
- **业务相关性高** - 直接反映交易行为对价格的影响
- **高解释力** - 清晰展示价格随交易推进的演变轨迹
### 📊 专业可视化工具集
#### 1. 价格序列分析 (volume_price_sequence.py)
- **主图**: 成交价序列图(简洁无干扰的价格轨迹)
- **侧图**: 成交量在价格上的分布图0.02间隔)
- **下图**: 当前成交量时间序列图
- **关键价格标注**: 成交量最大的10个价格水平虚线+双向标注)
#### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
- **7种专业图表**: 直方图、箱线图、累积分布函数等
- **统计摘要**: 完整的分布特征分析
- **交易模式识别**: 大单分析、分组统计
- **业务洞察**: 市场活跃度和机构参与度分析
#### 3. 成交量价格分布图 (volume_price_distribution.py)
- **单一专注**: 成交量在价格上的分布
- **前20排行**: 成交量最大的价格区间列表
- **精确分析**: 0.02价格间隔的详细分布
- **快速洞察**: 立即识别热门价格水平
## 🚀 快速开始
### 安装依赖
```bash
pip install pandas numpy matplotlib
```
### 基本使用
```bash
# 1. 价格序列分析(综合图表,推荐)
python volume_price_sequence.py
# 2. 成交量分布深度分析7种专业图表
python volume_distribution_analysis.py
# 3. 简化成交量价格分布图(快速分析)
python volume_price_distribution.py
# 4. 分析其他数据文件
python volume_price_sequence.py data/jm2509_20250709.csv
python volume_distribution_analysis.py data/jm2509_20250709.csv
python volume_price_distribution.py data/jm2509_20250710.csv
# 5. 查看帮助信息
python volume_price_sequence.py --help
python volume_distribution_analysis.py --help
python volume_price_distribution.py --help
```
### 系统要求
- Python 3.7+
- pandas, numpy, matplotlib, scipy
- 支持中文字体的环境
## 📈 输出示例
### 生成的图表
#### 1. 综合价格序列分析图 (推荐)
![综合价格序列分析图](au2512_volume_price_sequence.png) - **1.0MB**
**三合一综合分析图表**
- **主图**: 成交价序列图(简洁清晰,无技术指标干扰)
- **侧图**: 成交量在价格上的分布0.02间隔,水平柱状图)
- **下图**: 当前成交量时间序列图(交易活跃度变化)
- **关键价格标注**: 成交量最大的10个价格水平浅绿色虚线+双向标注)
#### 2. 成交量分布深度分析图
![成交量分布分析图](au2512_volume_distribution_analysis.png) - **1.1MB**
**7种专业分析图表**
- 直方图 + 概率密度拟合
- 箱线图(分位数分布)
- 累积分布函数
- 成交量时间序列
- 成交量分组柱状图
- 成交量贡献度条形图
- 统计摘要表
#### 3. 简化成交量价格分布图
![简化成交量价格分布图](au2512_volume_price_distribution.png) - **0.3MB**
**专注单一分析**
- 成交量在价格上的分布0.02间隔)
- 前20个成交量最大价格区间列表
- 关键统计信息标注
### 分析报告示例
#### 综合价格序列分析报告
```
开始AU2512期货成交量-成交价序列分析...
数据加载成功: 66,596 条记录
=== 数据分析 ===
数据概况:
累计成交量: 893,404 手
价格区间: 901.84 - 928.88
平均价格: 914.54
关键成交量节点:
起始: 成交量 320 手, 价格 904.76
25%: 成交量 273,254 手, 价格 911.94
50%: 成交量 527,232 手, 价格 909.18
75%: 成交量 724,868 手, 价格 921.62
结束: 成交量 893,404 手, 价格 927.48
综合价格序列图已保存: au2512_volume_price_sequence.png
【业务洞察】
1. 价格随成交量变化的完整轨迹清晰可见
2. 整体趋势: 上涨 (+2.51%)
3. 交易过程中价格呈现逐步上涨趋势
4. 关键价格水平与成交量分布密切关联
```
#### 成交量分布深度分析报告
```
开始AU2512期货当前成交量分布分析...
数据加载成功: 66,596 条记录
=== 基础统计分析 ===
平均成交量: 14.96 手
中位数成交量: 10.00 手
成交量标准差: 17.07 手
分布偏度: 2.939 (严重右偏)
=== 成交量模式分析 ===
大单交易定义: > 34.0 手 (90%分位数)
大单交易次数: 5,681
大单交易占比: 9.71%
大单成交量占比: 36.40%
成交量分组统计:
2-5手: 16,887 次 (28.9%) | 成交量: 49,572 手 (5.7%)
6-10手: 16,355 次 (27.9%) | 成交量: 126,216 手 (14.4%)
11-20手: 12,558 次 (21.5%) | 成交量: 191,344 手 (21.9%)
21-50手: 10,201 次 (17.4%) | 成交量: 321,680 手 (36.8%) 【主力】
【业务洞察】
1. 成交量分布呈现严重的右偏特征,小单交易为主,大单影响显著
2. 成交量波动较大,存在明显的活跃期和沉寂期
3. 大单交易占比较为重要,对市场流动性有显著影响
4. 21-50手交易是市场主力贡献36.8%成交量
5. 市场活跃度适中,交易较为频繁
```
#### 成交量价格分布报告
```
开始AU2512期货成交量价格分布分析...
数据加载成功: 66,596 条记录
【前20个成交最大的价格区间】
排名 价格区间 成交量 占比 累计占比
-----------------------------------------------------------------
1 922.00-922.02 4,044 0.5% 0.5%
2 921.90-921.92 2,678 0.3% 0.8%
3 907.70-907.72 2,460 0.3% 1.0%
4 908.00-908.02 2,434 0.3% 1.3%
5 927.00-927.02 2,332 0.3% 1.6%
...
分析完成!
```
## 💡 为什么选择成交量序列分析?
| 特性 | 传统时间序列 | 成交量序列 |
|------|-------------|------------|
| **解释力** | ⭐⭐ | ⭐⭐⭐⭐⭐ |
| **业务相关性** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| **趋势识别** | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| **决策价值** | ⭐⭐ | ⭐⭐⭐⭐⭐ |
### 传统方法的局限性
- ❌ 无法展示交易过程对价格的真实影响
- ❌ 时间间隔不均等,影响趋势判断
- ❌ 难以识别关键交易时点的价格变化
### 成交量序列的优势
- ✅ 清晰展示价格随交易推进的演变轨迹
- ✅ 便于识别不同交易阶段的价格水平
- ✅ 可以量化成交量对价格的影响
- ✅ 更符合期货交易的实际业务逻辑
## 📁 项目结构
```
jm_ces/
├── 📊 核心分析脚本
│ ├── volume_price_sequence.py # 综合价格序列分析 (22KB)
│ ├── volume_distribution_analysis.py # 成交量分布深度分析 (23KB)
│ └── volume_price_distribution.py # 简化成交量价格分布 (16KB)
├── 📈 生成的图表
│ ├── au2512_volume_price_sequence.png # 综合价格序列图 (1.0MB)
│ ├── au2512_volume_distribution_analysis.png # 成交量分布分析图 (1.1MB)
│ └── au2512_volume_price_distribution.png # 简化价格分布图 (0.3MB)
├── 📄 文档文件
│ ├── README.md # 项目说明文档
│ └── CLAUDE.md # Claude指导文档
└── 📂 数据目录
├── au2512_20251013.parquet # 增强后的数据(含当前成交量列)
├── au2512_20251013_backup.parquet # 原始数据备份
└── jm2509_*.csv # 其他期货数据文件
```
## 🗄️ 数据格式
### 支持的文件格式
- **Parquet文件** (推荐): `.parquet`
- **CSV文件**: `.csv`
### 必需字段
```
UTC, UTC.1, 时间, 累积成交量, 成交价, 成交额,
买1价, 卖1价, 买1量, 卖1量,
买2价, 卖2价, 买2量, 卖2量,
买3价, 卖3价, 买3量, 卖3量,
买4价, 卖4价, 买4量, 卖4量,
买5价, 卖5价, 买5量, 卖5量
```
### 关键字段说明
- `UTC`, `UTC.1`: UTC时间戳毫秒级
- `时间`: 当日累计时间格式MM:SS.秒)
- `成交价`: 最新成交价格
- `累积成交量`: 当日累计成交量
- `当前成交量`: 单笔成交量(由累计成交量差值计算)
- `数列号`: 按累计成交量排序的序号
- `买1价`~`买5价`: 买方五档价格
- `卖1价`~`卖5价`: 卖方五档价格
### 数据增强功能
- ✅ 自动计算当前成交量(累计成交量差值)
- ✅ 自动生成按成交量排序的数列号
- ✅ 支持原始数据和增强数据的无缝切换
## 🎯 应用场景
### 交易分析
- 快速识别价格在交易过程中的主要趋势
- 发现影响价格变化的重要成交量时点
- 评估不同交易阶段的价格行为
### 风险控制
- 通过价格波动区间评估风险水平
- 识别价格异常变化的临界点
- 制定基于成交量的风险管理策略
### 策略研究
- 为交易策略提供量化的数据支持
- 研究成交量对价格影响的历史规律
- 优化基于成交量变化的交易时机
### 市场研究
- 理解交易行为对价格的影响机制
- 研究价格发现的动态过程
- 分析市场微观结构特征
- 识别机构投资者交易模式
## 🔧 技术特性
- **高分辨率输出**: 300 DPI高清图表
- **智能字体检测**: 自动适配中文字体
- **容错处理**: 完善的错误处理和用户提示
- **灵活配置**: 支持命令行参数自定义
- **详细分析**: 完整的统计报告和业务洞察
- **数据增强**: 自动计算当前成交量和排序
## 🚀 核心功能亮点
### 🎯 创新分析方式
- **成交量序列分析**: 按累计成交量排序,更符合交易实际
- **关键价格标注**: 自动识别成交量最大的价格水平
- **多维度可视化**: 价格趋势 + 成交量分布的综合展示
- **精确价格间隔**: 0.02元标准间隔,符合期货市场特性
### 📊 三大分析工具对比
| 特性 | 综合序列分析 | 深度分布分析 | 简化分布图 |
|------|----------------|----------------|------------|
| **适用场景** | 日常综合分析 | 深度研究报告 | 快速价格扫描 |
| **图表复杂度** | 高(三合一) | 最高7种图表 | 低(单一图表) |
| **分析深度** | 价格趋势+成交量 | 统计+模式识别 | 价格分布 |
| **输出文件大小** | 1.0MB | 1.1MB | 0.3MB |
| **推荐使用** | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ |
### 🎨 视觉设计特点
- **关键价格标注**: 浅绿色虚线标识重要价格水平
- **双向标注**: 左侧显示价格,右侧显示成交量
- **价格对齐**: 主图与侧图完美同步
- **简洁清晰**: 移除技术指标干扰,专注原始数据
### 1. 价格序列分析 (volume_price_sequence.py)
#### 数据处理
- 自动检测并处理不同格式的数据文件
- 按累计成交量升序排列
- 计算关键成交量节点
- 生成移动平均线和波动区间
#### 可视化
- **成交价序列线**(蓝色主线):价格随成交量变化轨迹
- **当前成交量柱状图**:下方显示交易活跃度分布
- **移动平均线**(红色粗线):平滑价格趋势
- **价格波动区间**(红色阴影):不确定性范围
- **关键节点标注**:详细价格信息
- **分析结论框**:统计摘要
#### 统计分析
- 基础价格统计(最高、最低、平均)
- 成交量分析(分布、变化率)
- 关键节点影响分析
- 数据质量检查
### 2. 成交量分布深度分析 (volume_distribution_analysis.py)
#### 分布统计分析
- 基础统计(均值、中位数、标准差、分位数)
- 分布特征分析(偏度、峰度、变异系数)
- 正态性检验和分布拟合
- 异常值检测和处理
#### 交易模式分析
- 大单交易识别和分析
- 成交量分组统计1手、2-5手、6-10手等
- 交易频率和成交量贡献度分析
- 主力交易模式识别
#### 7种专业可视化
- **直方图 + 概率密度拟合**:分布形态分析
- **箱线图**:分位数分布和数据离散程度
- **累积分布函数**:概率累积情况
- **成交量时间序列**:交易活跃度变化
- **成交量分组柱状图**:各分组交易笔数对比
- **成交量贡献度条形图**:各分组成交量占比
- **统计摘要表**:完整的统计信息展示
#### 业务洞察
- 成交量分布特征解读
- 市场活跃度评估
- 机构参与度分析
- 交易建议和风险提示
## 🛠️ 开发信息
### 依赖项
- `pandas` - 数据处理和分析
- `numpy` - 数值计算
- `matplotlib` - 数据可视化
- `scipy` - 统计分析和分布拟合
- `seaborn` - 高级统计图表(可选)
### 代码质量
- 面向对象设计,易于维护和扩展
- 完整的错误处理和用户友好提示
- 详细的代码注释和文档
- 符合Python编码规范
## 🚀 快速导航
### 新手推荐流程
```bash
# 1. 先运行价格序列分析,了解整体价格趋势
python volume_price_sequence.py
# 2. 再运行成交量分布分析,深入了解交易模式
python volume_distribution_analysis.py
# 3. 查看生成的图表和报告
# - au2512_volume_price_sequence.png
# - au2512_volume_distribution_analysis.png
```
### 数据文件准备
```bash
# 确保数据文件存在且格式正确
ls -la data/au2512_20251013.parquet
# 如果需要处理新数据,确保包含必要字段
# UTC, 累积成交量, 成交价, 等...
```
## 📞 支持与反馈
### 问题报告
如果在使用过程中遇到问题:
1. **检查数据文件格式**:确保包含必需字段(累积成交量、成交价等)
2. **确认依赖库安装**`pip install pandas numpy matplotlib scipy`
3. **查看错误信息**:命令行会显示详细的错误提示
4. **中文字体问题**:确保系统支持中文字体显示
### 常见问题解决
- **字体显示异常**:脚本会自动检测并设置合适的中文字体
- **数据加载失败**:检查文件路径和文件格式
- **图表生成失败**:确保有足够的磁盘空间和写入权限
### 功能建议
欢迎提出改进建议和新功能需求,包括:
- 新的图表类型
- 更多的统计指标
- 更好的数据预处理
- 性能优化建议
## 📄 许可证
本项目采用 MIT 许可证,详见 LICENSE 文件。
## 🙏 致谢
感谢所有为期货数据分析和可视化做出贡献的开发者和研究人员,以及提供宝贵反馈的用户。
---
**版本**: 2.0
**最后更新**: 2025-11-02
**核心工具**:
- `volume_price_sequence.py` - 价格序列分析
- `volume_distribution_analysis.py` - 成交量分布深度分析
**项目状态**: ✅ 活跃维护中
**新增功能**:
- ✅ 成交量分布深度分析
- ✅ 当前成交量柱状图
- ✅ 7种专业可视化图表
- ✅ 业务洞察和交易建议