内容每5分钟更新
客服QQ:4008017500

给一个完整的决策树预...

共21条1页 30条/页首页上一页第1页下一页尾页

点击：回复：1514 关闭此页

给一个完整的决策树预测3D和值大小的源代码，并加入决策树规则

楼主

杨哥哥儿 | 发表于2025-06-18 21:11:31

本帖最后由杨哥哥儿于 2025-6-18 21:26 编辑

code:

# -*- coding: utf-8 -*-
'''
完整的决策树预测3D彩票涨跌的源代码，并加入决策树规则。
'''
import pandas as pd
import numpy as np
from sklearn.tree import DecisionTreeClassifier, export_text
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import matplotlib.pyplot as plt

# 获取彩票历史数据
def get_fc3d_data():
    # 读取文本文件（开奖文件），分隔符为空格，第一列为索引
    df = pd.read_csv(r'3d_asc.txt',delimiter=' ',index_col=0)
    # 删除不需要的数据，按列删除
    df.drop(df.columns[[4,5,6,7,8,9,10,11,12,13,14,15]], axis=1, inplace=True)#删除多余列
    # 设置各列的名称
    df.columns = ['日期', '百', '十','个']
    # 求和值
    df['和值']=df['百']+df['十']+df['个']    
    # 遍历每一行，处理并新增列
    for index, row in df.iterrows():
        df.loc[index, '跨度'] =np.abs(row['百'] - row['十'])+np.abs(row['百'] - row['个'])+np.abs(row['个'] - row['十'])
    return df

# 特征工程
def create_features(df):
    # 基础和值特征
    df['pct_change'] = df['和值'].pct_change()
    df['ma5'] = df['和值'].rolling(5).mean()
    df['ma10'] = df['和值'].rolling(10).mean()
    
    # 动量指标
    df['rsi'] = calculate_rsi(df['和值'])
    
    # 跨度关系
    
    df['vol_ma5'] = df['跨度'].rolling(5).mean()
    df['kua_he_corr'] = df['和值'].rolling(10).corr(df['跨度'])
    
    # 标记大小标签(1=大, 0=小)
    df['label'] = np.where(df['pct_change'].shift(-1) > 0, 1, 0)
    
    return df.dropna()

# 计算RSI指标
def calculate_rsi(prices, window=14):
    delta = prices.diff()
    gain = delta.where(delta > 0, 0)
    loss = -delta.where(delta < 0, 0)
    avg_gain = gain.rolling(window).mean()
    avg_loss = loss.rolling(window).mean()
    rs = avg_gain / avg_loss
    return 100 - (100 / (1 + rs))

# 决策树规则可视化
def show_rules(tree_model, feature_names):
    tree_rules = export_text(
        tree_model, 
        feature_names=list(feature_names),
        max_depth=3
    )
    print("决策树核心规则：\n", tree_rules)

if __name__ == '__main__':
    # 数据准备
    stock_data = get_fc3d_data()
    df = create_features(stock_data)
    
    # 特征选择
    features = ['ma5', 'ma10', 'rsi', 'vol_ma5', 'kua_he_corr']
    X = df[features]
    y = df['label']
    
    # 划分数据集
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.2, random_state=42
    )
    
    # 构建决策树模型
    dt_model = DecisionTreeClassifier(
        max_depth=5,
        min_samples_split=20,
        criterion='gini',
        random_state=42
    )
    dt_model.fit(X_train, y_train)
    
    # 模型评估
    y_pred = dt_model.predict(X_test)
    print("测试集准确率:", accuracy_score(y_test, y_pred))
    
    # 输出决策规则
    show_rules(dt_model, features)
    
    # 特征重要性可视化
    plt.figure(figsize=(10,5))
    pd.Series(dt_model.feature_importances_, index=features)\
        .sort_values().plot(kind='barh')
    plt.title('Feature Importance')
    plt.show()

该代码实现了完整的股票预测流程，包含数据获取、特征计算和决策树建模。核心决策规则通过export_text函数可视化输出，特征重要性通过柱状图展示。
典型决策规则可能包含"RSI<30且跨度增加则看涨"等逻辑。
代码说明：
使用pd.read_csv(r'3d_asc.txt')数据，计算5/10日均线、RSI等技术指标作为特征，决策树通过基尼系数选择最优分割点，最终输出可解释的和值大小的开出规则。
你就可以根据AI算出的规则去预测下和值的开出情况了。
规则结果如下：

code:

测试集准确率: 0.6955997588908981
决策树核心规则：
 |--- rsi <= 51.58
|   |--- rsi <= 47.16
|   |   |--- rsi <= 44.22
|   |   |   |--- ma5 <= 14.50
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma5 >  14.50
|   |   |   |   |--- truncated branch of depth 2
|   |   |--- rsi >  44.22
|   |   |   |--- ma10 <= 16.55
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma10 >  16.55
|   |   |   |   |--- class: 0
|   |--- rsi >  47.16
|   |   |--- ma5 <= 13.30
|   |   |   |--- rsi <= 49.08
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- rsi >  49.08
|   |   |   |   |--- truncated branch of depth 2
|   |   |--- ma5 >  13.30
|   |   |   |--- ma5 <= 16.10
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma5 >  16.10
|   |   |   |   |--- truncated branch of depth 2
|--- rsi >  51.58
|   |--- ma5 <= 12.50
|   |   |--- rsi <= 53.42
|   |   |   |--- ma5 <= 11.10
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma5 >  11.10
|   |   |   |   |--- truncated branch of depth 2
|   |   |--- rsi >  53.42
|   |   |   |--- ma10 <= 14.45
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma10 >  14.45
|   |   |   |   |--- truncated branch of depth 2
|   |--- ma5 >  12.50
|   |   |--- rsi <= 53.46
|   |   |   |--- ma5 <= 16.10
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- ma5 >  16.10
|   |   |   |   |--- truncated branch of depth 2
|   |   |--- rsi >  53.46
|   |   |   |--- rsi <= 58.64
|   |   |   |   |--- truncated branch of depth 2
|   |   |   |--- rsi >  58.64
|   |   |   |   |--- truncated branch of depth 2

算法是借股票的算法来完成的，可以较好的帮助大家理解。

更新了跨度计算公式，=|百-十|+|百-个|+|十-个|，没有了复杂的判断语句，值是跨度的2倍，不影响使用。

1楼

杨哥哥儿 | 发表于2025-06-18 21:12:20

AI辅助彩票研究专题（六）常用机器学习算法与彩票的关联
这个专题明天再发帖。

2楼

duy3 | 发表于2025-06-19 00:41:46

3楼

孔夫子 | 发表于2025-06-19 15:38:17

4楼

刘柏辰 | 发表于2025-06-19 18:22:22

就是看不懂

5楼

showtime2016 | 发表于2025-06-19 20:50:06

6楼

吾自暗香 | 发表于2025-06-20 14:45:57

👍👍👍👍👍俺是看不懂，找身边的人给研究一下，好用，感谢感谢老师，一直想找这方面的知识

7楼

坚强才能飞翔 | 发表于2025-06-20 21:33:51

我这成功了没有呢？

8楼

秦键 | 发表于2025-06-21 05:04:28

一般人看不懂，谢谢杨哥儿

9楼

weifengcz | 发表于2025-06-21 08:28:46

10楼

duy3 | 发表于2025-06-21 17:23:06

11楼

百年复兴 | 发表于2025-06-21 20:35:24

这么高傲复杂不一定能中奖，我简单的几个方法i经常中奖。

12楼

xujun155 | 发表于2025-06-22 09:54:50

厉害了我的哥！

13楼

追踪魅影 | 发表于2025-06-22 10:29:51

爽歪歪啊！这要是不中奖还玩个锤子。

14楼

追踪魅影 | 发表于2025-06-22 11:13:15

趋势双轨破顶底重磅炸弹。

15楼

追踪魅影 | 发表于2025-06-22 11:14:47

趋势双轨破顶底重磅炸弹。

16楼

追踪魅影 | 发表于2025-06-22 11:22:15

期期纵向顺码出端昵，
玩转万四万十不中奖难。
独孤求败难！难于上青天！
洒家一瓶古柯红酒进肚吐真言，
不明所以的玩尿泥去丷。

17楼

追踪魅影 | 发表于2025-06-22 11:31:12

建模立树砍技叉，AI脑把我私密改捞去了，
我往后还玩得转主任嘛？
主任的AI在大数据库里把我的鸟改捞去了
我不就剩下了双眼瞪蛋滚球了。

18楼

躲避0几率 | 发表于2025-06-22 11:42:31

这么用心不发财都难

19楼

追踪魅影 | 发表于2025-06-22 12:36:34

说股票买买买出底坑，抛抛抛出顶锋，
不来钱天理不容。

20楼

坚强才能飞翔 | 发表于2025-06-23 17:58:10

期待杨哥哥的精彩继续！！！

共21条1页 30条/页首页上一页第1页下一页尾页

参与原帖交流，请访问:

http://bbs.17500.cn/thread-11844797-1-1.html