# 花 8 个月向 Claude 问「蠢问题」,我意外造出了一个零售级量化交易平台
> 八个月前,我给了 ChatGPT 400 美元让它帮我交易。第一笔就翻倍了。然后它说它看不到实时股价。经典!于是我做了一个理性人都会做的事:花八个月从零搭建了一整套交易平台,在聊天框里疯狂给 Claude 发消息,慢慢把自己逼疯。
这是 Reddit r/SideProject 上一位开发者的真实经历。他从一个简单的「让 AI 帮我交易」想法出发,历经四个版本迭代,最终开源了 Temple Stuart —— 一个面向创始人交易员、自由职业者和复杂财务生活的统一金融操作系统。
项目概述
Temple Stuart 是一款个人财务后台 / 金融操作系统,旨在用一套系统替代 Mint、QuickBooks、TraderSync、TurboTax 等 5+ 分散工具,同时保持数据透明、可审计、用户可控。
核心理念:
– 准确性优先于便利性
– 透明优先于黑盒
– 用户控制优先于 AI 假设
– 复式记账,否则免谈
项目采用 AGPL v3 + 商业双许可,个人使用免费,商业使用需购买授权。
从 Prompt 到 Web App:四个版本的进化史
版本 1:纯 Prompt 量化策略
核心策略蓝图:期权交易量化机器人
不知怎么的,我在第一笔交易中就赚了一倍的钱,我兴奋极了,于是把整个交易都推倒重来,试图做出一个更好的交易提示。
版本 2:截图喂链 + 更复杂的 Prompt
对于这个提示,我截取了实时期权链的屏幕截图,并将它们输入到提示中,以为这就是圣杯。
系统说明:您是 ChatGPT,一家精英量化基金的期权研究主管。您的任务是分析用户当前的交易组合,该组合显示在附件图片中,时间戳显示为 60 秒前,代表实时市场数据。分析数据类别:基本面数据点:每股收益 (EPS)、营收、净利润、EBITDA、市盈率 (P/E)、市销率、毛利率和营业利润率、自由现金流收益率、内部交易、前瞻性指引、PEG 比率(前瞻性预测)、卖方综合倍数、内部情绪分析(深度分析)。期权链数据点:隐含波动率 (IV)、Delta、Gamma、Theta、Vega、Rho、未平仓合约量(按行权价/到期日划分)、成交量(按行权价/到期日划分)、偏度/期限结构、IV 排名/百分位数(基于 52 周 IV 历史数据)、实时(< 1 分钟)完整链、周线/深度分析。价外期权 (OTM) 行权价 交易商伽玛/魅力值风险敞口图 专业隐含波动率表面及分钟级隐含波动率 价格及成交量百分位 历史数据点:每日开盘价、最高价、最低价、收盘价、成交量 (OHLCV) 历史波动率移动平均线(50/100/200日) 平均真实波幅 (ATR) 相对强弱指数 (RSI) 移动平均收敛/发散指标 (MACD) 布林带 成交量加权平均价格 (VWAP) 枢轴点 价格动量指标 日内 OHLCV(1分钟/5分钟间隔) 逐笔成交量 实时综合行情 其他数据点:社交情绪(Twitter/X、Reddit) 新闻事件检测(标题) Google Trends 搜索兴趣 信用卡消费趋势 地理位置客流量(Placer.ai) 卫星图像(停车场数量) 应用下载趋势(Sensor Tower) 招聘信息 大规模产品定价抓取付费社交情绪汇总宏观指标数据点:消费者价格指数 (CPI)、GDP 增长率、失业率、10 年期国债收益率、波动率指数 (VIX)、ISM 制造业指数、消费者信心指数、非农就业数据、零售销售报告、FOMC 会议纪要实时文本、实时国债期货和 SOFR 曲线。ETF 和资金流动数据点:SPY 和 QQQ 每日资金流动、行业 ETF 每日资金流入/流出 (XLK、XLF、XLE)、对冲基金 13F 文件、ETF 空头头寸、日内 ETF 申购/赎回组合、杠杆 ETF 再平衡预期、大额赎回通知、指数重构公告。分析师评级和修正数据点:共识目标价(标题)、近期评级上调/下调、新增覆盖、盈利和收入预期修正、保证金预期变化、空头头寸更新、机构持股变化、完整的卖方模型修正、建议分散度。交易选择标准:交易数量:目标 5:在保持投资组合 Delta、Vega 和行业敞口限制的前提下,最大化优势。硬性筛选条件(剔除不符合以下条件的交易):报价时间 ≤ 10 分钟;最佳期权盈利概率 (POP) ≥ 0.65;最佳期权收益/最大损失比率 ≥ 0.33;最佳期权最大损失 ≤ 100 美元的 0.5%。000 净值(≤ 500 美元)选择规则:按模型评分对交易进行排名。确保分散化:每个 GICS 行业最多 2 笔交易。净篮子 Delta 值必须保持在 [-0.30, +0.30] × (净值 / 100k) 之间。净篮子 Vega 值必须 ≥ -0.05 × (净值 / 100k)。如果出现平局,则优先选择 momentum_z 和 flow_z 值更高的交易。输出格式:请严格以简洁的文本表格形式提供输出,仅包含以下列:股票代码、策略、交易腿、交易理念(≤ 30 字,简明语言)、POP 附加指南:每笔交易的分析理念限制在 ≤ 30 字以内。使用直白的语言,避免夸大其词。请勿在指定表格之外添加任何其他输出或解释。如果满足所有标准的交易少于 5 笔,请明确指出:“满足标准的交易少于 5 笔,不执行。”
版本 3:Python 自动化流水线
工作原理(每日自动运行):
步骤 0 – 构建投资组合:提取标普 500 指数 → 保留价格在 30 美元至 400 美元之间、买卖价差小于 2% 的股票。获取期权(剩余期限 15 至 45 天,行权价 20 美元以上)。保持隐含波动率在 15% 至 80% 之间。综合考虑流动性、隐含波动率和行权价 → 筛选出流动性最佳的 22 只股票。提取 Finnhub 三天的新闻标题和摘要。
步骤 1-7 – 构建信用价差:实时获取报价和期权信息。剔除流动性差的行权价(中点价低于 0.30 美元或价差大于 10%)。添加完整的希腊字母。构建看涨看跌期权/看跌看涨期权组合(价差 Δ 15-35%)。使用 Black-Scholes 模型,并根据每个行权价计算隐含波动率 (IV) 来计算盈利能力 (PoP)。保持投资回报率 (ROI) 为 5-50%,盈利能力 (PoP) ≥ 60%。计算 (ROI × PoP)/100 的得分 → 选取最佳的 22 个期权 → 选取前 9 个期权并标记行业。
步骤 8-9 – GPT 新闻过滤:8. 对于每笔热门交易,GPT 读取 3 条新闻标题,标记盈利/FDA/并购等敏感信息,给出 1-10 的热度值,并给出交易/等待/跳过的指示。9. 输出 = 清理后的表格 + CSV 文件。
步骤 10 – 自动化!:10_run_pipeline.py 每天早上运行所有端到端流程。(约 1000 秒)
收据(简要概览) 起始:存入 400 美元(6 月 20 日) 今日:总回报约 300% 胜率:约 70-80%(每周波动) 策略:看跌期权/看涨期权,到期日 0-33 天,避开财报季和二元期权事件,只做小价差交易(我会在 Instagram 账号 temple_stuart_accounting 上发布损益表和交易卡,如果记得的话。)
整个流程——从头到尾共 50 个文件——仍然保留着原始形式: github.com/stonkyoloer/News_Spread_Engine
版本 4:Temple Stuart(当前)
它扫描 500 只股票,将每一只股票都输入评分引擎,挑选出最佳设置,并给我一张完整的交易卡,其中包含实际建议的仓位——以及对“为什么”的简单英语解释。
让我来详细地给你讲解一下它的工作原理。
该系统从三个来源获取数据。全部免费,全部实时。
(1) 我的经纪账户 Tastytrade 为每只股票提供 41 个数据点:
- 目前期权价格有多贵(隐含波动率)
- 股票实际波动幅度(历史波动率)
- 与去年相比,期权价格是便宜还是昂贵(IV排名)
- 完整的期权链——每个行权价、每个到期日、实时买卖价
- 实时希腊字母(delta、theta、vega——期权定价背后的数学原理)
(2)Finnhub 为我提供了基础知识和信息:
- 每只股票的财务指标(收入、利润率、现金流、债务等所有指标)
- 分析师评级(买入、持有、卖出评级各占多少)
- 内部交易(高管是否在买卖自己的股票?)
- 盈利历史(公司业绩是否超出预期?)
- 带有日期的新闻标题
(3)FRED (美联储数据库)让我了解了全局:
- VIX(市场恐慌指数)
- 利率
- 失业
- 通货膨胀
- 国内生产总值
- 消费者信心
这是原材料。现在来看看它们接下来会发生什么!
评分引擎——500 只股票如何变成 8 只
每只股票都会根据四个类别获得0到100分的评分。你可以把它想象成一份成绩单。
Vol-Edge(定价有误吗?)
这就回答了一个问题:期权的价格是否过高?
如果一只股票每年波动11%,但期权定价却按27%的波动幅度计算,那肯定有人搞错了。这种价格差距正是期权优势所在。
该系统会衡量隐含波动率与历史波动率的对比,考察期限结构(短期期权是否比长期期权更贵?),并检查技术指标。如果期权定价过高,卖方就占据优势;如果定价过低,买方就占据优势。
质量(公司是否可靠?)
我不会出售一家可能破产的公司的期权。
它会运行 Piotroski F-Score(教授们用来发现优秀公司的 9 点检查清单)、Altman Z-Score(预测破产风险),以及对盈利能力、增长和效率的检查。
一家盈利、增长、偿还债务并产生现金流的公司得分高。一家烧钱且利润率下降的公司得分低。就这么简单。
政权(经济形势如何?)
市场情绪起伏不定。有时经济增长但并不过热(恰到好处)。有时通货膨胀失控(过热)。有时一切都崩溃瓦解(收缩)。
该系统读取美联储的9项宏观经济指标,并对当前经济形势进行分类。然后,根据每只股票与当前形势的契合程度进行评分。
关键在于:如果一只股票与标普500指数的走势几乎无关(相关性低),系统会降低其市场机制评分。因为宏观经济对该股票的影响不大。一只与标普500指数相关性为0.27的股票,其市场机制评分会被降低36%。而一只与市场走势完全一致的股票则会获得满分。
Info-Edge(最近有什么新鲜事?)
它结合了五个信号:
- 分析师共识(专业人士看好吗?)
- 内部人士活动(高管是否在买入自家股票?这通常是个好兆头。卖出呢?这是个警示信号。)
- 盈利势头强劲(持续超出预期?)
- 期权交易流向(看涨期权与看跌期权的交易量异常?)
- 新闻情绪(新闻标题是越来越正面还是越来越负面?)
汇聚门——为什么叫“汇聚”?
关键在于:任何单一信号都可能出错。内部人士买入本身意义不大。高隐含波动率排名本身也意义不大。
但是,当多个独立信号都指向同一方向时呢?那就是收敛。这时,概率实际上会向你有利的方向倾斜。
该系统要求至少四项指标中有三项得分高于 50 分,才会考虑买入股票。四项指标全部高于 50 分则可全仓买入;三项高于 50 分则可半仓买入;少于三项高于 50 分则不予交易,无论单项得分有多高。
交易卡——这才是主打产品!
对于每一只存活下来的股票,系统都会生成一张实际的交易卡。
不是“或许可以考虑铁鹰式期权组合”,而是实际的仓位,有实际的行权价、实际的价格和实际的风险。
为什么进行这笔交易 (用简单易懂的英语解释,避免使用晦涩难懂的金融术语):
风险提示:
关键数据:
一切尽在掌握。一张卡片,无需点击,无需查找。截图即可了解全部信息。
所有这些信息都来自真实数据!
克劳德实际做了什么(以及没做什么)
这是人们容易出错的地方。
克劳德没有:
- 挑选股票
- 决定交易什么
- 预测未来
- 完全不做任何决定
克劳德确实:
- 请阅读每张交易卡的简明英语信号部分。
- 将晦涩难懂的数字翻译成普通人能理解的句子。
评分引擎完全基于确定性数学,不涉及人工智能。每次输入相同,输出也相同。注册会计师可以逐一审计每个数字的来源。
(我花了大量时间进行审核,以确保数据完整且干净,这可不是件轻松的事!)
克劳德的唯一工作就是翻译层。它将“IV 27.2%,HV 11.2%,IV/HV 比率 2.42”翻译成“期权定价是股票实际价格波动的 2.4 倍”。
就是这样。机器人能读懂数学公式,并用英语解释出来。我来做决定。
核心特性
1. 复式记账引擎(Production Ready)
– Plaid 同步:银行、券商、信用卡多机构导入
– 自动分类:商户映射 + 置信度,学习用户修正
– 实体分离:P-(个人)· B-(企业)· T-(交易)前缀
– 银行对账、资产负债表、损益表、期间结账
2. 交易分析 + AI 扫描(Production Ready)
– Convergence Pipeline:500 只 S&P 500 股票,四维评分(Vol-Edge、Quality、Regime、Info-Edge)
– Convergence Gate:4 类中至少 3 类得分 > 50 才进入交易卡片生成
– 交易卡片:真实行权价、权利金、最大盈亏、PoP、风险回报,带人话解释
– Tastytrade API:实时期权链、Greeks、IV/HV
– Finnhub:新闻、分析师评级、内幕交易
– FRED:VIX、利率、失业率、通胀等宏观指标
– xAI Grok:X/Twitter 社交情绪(可选)
3. 旅行规划(Production Ready)
– Duffel GDS:实时航班搜索与预订
– Google Places:目的地地点推荐
– Grok AI:地点情感评分、适配度、风险提示
4. 预算、税务、Hub 指挥中心
– 六模块预算、AI 膳食规划、Form 1040 估算、Schedule C/D、Wash Sale 检测
– Hub 统一日历、预算对比、旅行计算器

评论(0)