“票面自由度高”
票据多由不同业务员手写,字体、力度、倾斜度差异大;存在跨行书写、涂改划线、覆盖签字等情况,传统 OCR 模型经常一错全错。
客户是一家覆盖华南三省的快消品分销商,每天从近 800 家终端门店手工接单,再由后台录单员录入 ERP 进行发货与对账。订单几乎全部为手写,且票面状态远比示例图复杂。
票据多由不同业务员手写,字体、力度、倾斜度差异大;存在跨行书写、涂改划线、覆盖签字等情况,传统 OCR 模型经常一错全错。
数量与单价、备注与品名常常混排;缩写如 "红牛 6 听"、"老干妈辣 ×3" 需要结合行业语义才能正确归一化为标准 SKU。
客户每天有 1,200~1,800 张手写订单需要在 30 分钟内完成入库,2 名录单员持续加班,仍然存在 0.7% 左右的误录漏录率。
数量、单价或客户名称一旦录错,会同步影响发货、对账、月度结算,误差不止于“麻烦”,而是真金白银的资损。
下面这张是客户真实场景中的一张手写订货单(已脱敏)。我们把原图、识别结果叠加图、以及最终落库的结构化 JSON 同屏展示,让客户对“AI 究竟做了什么”建立一手认知。


纸张折痕导致字段错位,模型仍正确归位 12/12 行。
原价被划掉、上方手写新价格,识别结果取最新值并保留审计痕迹。
备注列字迹压住单价列网格,由结构化后处理还原列归属。
面对一个真实业务场景,我们不会一上来就选定某条技术路线。在与客户对齐目标之后,我们对三条候选路径都做了同口径的样本评估,再据此设计融合方案,让每条路径都做它最擅长的那部分。
我们最终交付的不是某一个模型,而是一条 “自研 OCR 主链路 + 多模态语义校正 + 云厂商兜底” 的融合管线: 超过 90% 的日常票面由自研模型在 1 秒内完成识别;置信度低于阈值的字段会走多模态大模型做二次理解; 当样本质量极差或服务异常时,会自动降级到云厂商 OCR 并标记人工复核。
这种结构让"准确率、成本、延迟、可控性"这四个互相牵扯的目标得以同时达成,也是我们在每一个 AI 项目里都会强调的工程哲学:用工程把模型的不确定性收敛为业务的确定性。
我们坚持把 AI 工程当作“管线”而不是“黑盒”:每一步都有明确职责、明确输入输出、明确兜底策略。下面这五步管线 + 四层系统架构,是这套手写订单 OCR 方案的全部技术骨架。
通过移动端 / 扫码枪 / 飞书表单等多通道采集,统一做去畸变、白平衡、阴影抑制与版式校正,把“图像质量”这一变量先排除掉。
使用基于 DBNet++ 的字段检测器,先识别整张票的逻辑结构(表头、行、列),再为每一个手写笔画绑定语义角色(品名/数量/单价/备注)。
字符识别由自研 GS-OCR-Hand v2 担纲,针对客户的 4.6 万张真实样本做了领域微调;置信度低于 0.85 的字段会自动转入下一步语义复核。
对于涂改、跨行、上下文依赖强的字段,调用多模态大模型,结合该客户的 SKU 词典与历史订单上下文做“读懂”层面的二次校正。
把识别结果按业务规则做归一化:单位换算、价格区间校验、客户实体匹配、合计金额闭环校验,最终输出可直接入 ERP 的结构化记录。
支持 5 种业务通道接入,统一做幂等、限流与脱敏。
三条推理链路 + 路由器,按置信度与样本特征自动切换。
把识别结果对接到 ERP / 对账 / 复核工单的真实业务流。
线上每一次识别都会反哺到训练数据集,让模型每月自动迭代。
我们把每一个 AI 方案都做成"可被验收 + 可被迭代"的项目:交付前是十周的工程化落地,交付后是持续的数据闭环。下面是这次手写订单识别项目的真实时间线。
和客户业务侧、IT 侧一起把订单流走一遍,明确“哪一步要替换、哪一步要保留”。
采集 4,600 张真实票面,构建首版训练集与评测集,统一标注规范。
在同一评测集上跑通云厂商 / 多模态 / 自研三条路径,输出选型报告。
构建置信度路由 + 多模态校正 + 兜底降级的完整管线,并完成压力测试。
在客户 1 个仓库灰度运行两周,每张票面同时双跑(AI + 人工)做对账。
推全到 6 个仓库 / 800 家终端,关键指标达成预设 KPI 后正式签收。
线上误差自动回流到样本仓,每月触发一次增量微调,模型能力随业务一起长。
我们不喜欢用“显著提升”这种含糊词。下面是上线前后同口径、同样本下的关键指标对比,以及客户原话——这些是衡量这个 AI 方案是否真正解决问题的最直接证据。
“过去我们最怕的就是月底对账,因为录单员稍微看花眼一行,整张单的数字都会错。滚水科技这套 OCR 方案上线之后,我们 6 个仓库的订单基本上是“扫一下、几秒钟、自动入 ERP”,月底对账差异从 0.7% 掉到了万分之四。更重要的是,它没有让我们把数据交给某个外部黑盒——所有模型权重和数据都在我们自己的私有云里。
李李先生 · 客户方 IT 总监 · 华南某快消分销集团
这套“自研 OCR + 多模态校正 + 兜底降级”的工程范式,并不局限于手写订单。所有“票面 / 表单 / 单据”类的识别问题,都可以基于这套骨架快速迁移落地。
厨师长 / 楼面写就的库存补货单,识别后直达进销存系统。
业务员从门店带回的回单,扫一下即可同步月度销售台账。
户外票面常有油污、皱褶,融合方案对环境鲁棒性更好。
字段语义敏感(剂量/单位),结合 SKU 词典做严格校验。
签字与备注混排,识别后直接回写到运单管理系统。
高合规要求场景下提供本地部署 + 全链路审计。
我们是一家以"软件定制 + AI 工程化"为主业的团队。过去三年里,我们把超过 20 个 AI 场景从"看上去能做"推到"能在生产环境稳定运行 12 个月以上"——这背后不是某种单一技术,而是一套被反复验证过的工程方法论。

先聊一次方案对齐,不收费、不绑定。我们会和你一起把场景拆开,判断这个问题是否值得用 AI 来做、用哪一种 AI 做最划算,并在 5 个工作日内给你一份可落地的初步方案与报价。