NumberAI
NoppoStudioが開発する、多機能手書き文字認識エンジン「NumberAI」のリサーチモデルです。 本モデルは、多様な表記体系における「数値」の識別および、難読性の高い手書き文字の解析を目的に設計されています。
概要 (Overview)
NumberAIは、手書き文字における複数の数値表記を高い精度で分類する画像認識モデルです。 現在、以下の3つの表記体系および特殊な筆跡に対応しています。
- アラビア数字 (0-9): 標準的なMNISTに加え、人間でも判読が困難なほど特徴的・癖の強い筆跡についても重点的に学習しており、難読文字への高い耐性を備えています。
- 漢数字 (一, 二, 三...): 日本の伝統的な表記体系への対応。
- ローマ数字 (I, II, III...): 欧州の伝統的な表記体系への対応。
本モデルは、これらを単一の分類タスクとして統合処理する「NoppoResNetV2」アーキテクチャを採用しています。
学習データと仕様 (Training & Specifications)
- Input Size: 28x28 pixels (Grayscale)
- Model Architecture: NoppoResNetV2 (Custom ResNet)
- Training Strategy: 多様な筆跡バリエーション(難読文字を含む)を網羅したデータ拡張および学習。
導入と使用方法 (How to Use)
import torch
from model_v2 import NoppoResNetV2
# モデルの初期化 (クラス数は実装済みの数値カテゴリに準拠)
model = NoppoResNetV2(num_classes=23)
model.load_state_dict(torch.load("noppo_resnet_model.pth"))
model.eval()
今後の展望 (Future Roadmap)
現在は数値認識および難読文字への対応に特化していますが、将来的には日本語全般を網羅する万能な文字認識エンジンへの拡張を予定しています。
- ひらがな (K49): 全49文字の統合および認識テスト。
- 常用漢字 (KKanji): 数千規模のクラス分類へのスケールアップと最適化。
ライセンス (License)
Apache License 2.0に基づき公開されています。
© 2026 NoppoStudio