karukan-im

Linux向け日本語IME。fcitx5上で動作し、GPT-2ベースのモデルでニューラルかな漢字変換を行います。

Features

ニューラルかな漢字変換（llama.cppによるGGUF推論）
変換学習（ユーザーの変換履歴を記憶し、完全一致・前方一致で候補を優先表示）
日本語・英数字の混合入力（Shift切り替え）
Surrounding Textによる文脈を考慮した変換
システム辞書・ユーザー辞書による候補補完

Note

モデル推論だけでは語彙が限られるため、システム辞書の併用を強く推奨します。システム辞書はIMEに同梱されていないため、別途インストールが必要です。詳しくは Dictionary を参照してください。

Install

Prerequisites

Rust

sudo apt install fcitx5 fcitx5-modules-dev libfcitx5core-dev \
    libfcitx5config-dev libfcitx5utils-dev extra-cmake-modules \
    cmake make gcc g++ pkg-config \
    clang libclang-dev \
    libssl-dev libxkbcommon-dev

cmake, make, gcc, g++: C/C++ ビルドツール（llama.cpp のビルドに必要）
pkg-config: ライブラリ検出
clang, libclang-dev: bindgen による FFI バインディング生成に必要
libssl-dev: HTTPS通信（モデルダウンロード等）
libxkbcommon-dev: キーボード処理

Build & Install (システムインストール)

/usr にインストールします。sudo が必要ですが、FCITX_ADDON_DIRS の設定は不要です。

cd karukan-im/fcitx5-addon
cmake -B build -DCMAKE_INSTALL_PREFIX=/usr
cmake --build build -j
sudo cmake --install build
fcitx5 -r

Build & Install (ユーザーローカル)

~/.local にインストールします。sudo 不要ですが、FCITX_ADDON_DIRS の手動設定が必要です。

cd karukan-im/fcitx5-addon
cmake -B build -DCMAKE_INSTALL_PREFIX=$HOME/.local
cmake --build build -j
cmake --install build

ローカルインストールの場合、fcitx5 がアドオンを見つけられるように FCITX_ADDON_DIRS を設定する必要があります。fcitx5 はログインセッション開始時に起動されるため、シェルプロファイルではなく ~/.config/environment.d/ に設定してください:

mkdir -p ~/.config/environment.d
SYSTEM_FCITX5_DIR=$(pkg-config --variable=libdir Fcitx5Core)/fcitx5
echo "FCITX_ADDON_DIRS=$HOME/.local/lib/fcitx5:$SYSTEM_FCITX5_DIR" \
    > ~/.config/environment.d/fcitx5-karukan.conf

Important

FCITX_ADDON_DIRS にはローカルパスとシステムパスの両方を含める必要があります。システムパスが欠けると fcitx5 の標準アドオン（wayland、classicui 等）が見つからなくなります。

設定後、ログアウトして再ログインしてください。再ログイン後、fcitx5 のログに Loaded addon karukan が表示されることを確認してください:

fcitx5 -r -d

ログに Loaded addon karukan が表示されることを確認してください:

I2026-02-24 22:57:54.252982 addonmanager.cpp:195] Loaded addon karukan

Warning

以前のバージョンで install-local.sh を使用した場合、~/.config/environment.d/fcitx5-karukan.conf にシステムパスを含まない FCITX_ADDON_DIRS（例: FCITX_ADDON_DIRS=/home/user/.local/lib/fcitx5）が設定されている可能性があります。このファイルが残っていると fcitx5 のシステムアドオンが見つからなくなり、以下のようなエラーが発生します:

fcitx5 -rd 
E addonloader.cpp:32] Could not locate library libwayland.so for addon wayland.
E addonloader.cpp:32] Could not locate library libclassicui.so for addon classicui.

この場合はファイルを削除した上でログアウト（または再起動）してください:

rm ~/.config/environment.d/fcitx5-karukan.conf

インストール後、fcitx5-configtool（Fcitx Configuration）を開き、右側の「Available Input Method」で「karukan」を検索して「Karukan」を左側に追加してください。

Note

初回起動時にHuggingFaceからGGUFモデル（GGUF + tokenizer）を自動ダウンロードするため、起動に数分かかる場合があります。ダウンロード中はfcitx5のログに以下のような進捗が表示されます:

I2026-02-24 23:12:12.651828 addonmanager.cpp:195] Loaded addon karukan
jinen-v1-small-Q5_K_M.gguf [00:00:05] [████████████████████████] 84.39 MiB/84.39 MiB 7.89 MiB/s (0s)
tokenizer.json [00:00:00] [████████████████████████████████] 1.95 MiB/1.95 MiB 6.45 MiB/s (0s)
jinen-v1-xsmall-Q5_K_M.gguf [00:00:02] [████████████████████████] 29.73 MiB/29.73 MiB 9.15 MiB/s (0s)
tokenizer.json [00:00:00] [████████████████████████████████] 1.95 MiB/1.95 MiB 8.12 MiB/s (0s)

ダウンロードが完了するまで変換機能は使用できません。2回目以降はキャッシュ済みのモデルが使われるため、すぐに起動します。

Key Bindings

ひらがな入力モード

キー	動作
文字キー	ローマ字入力 → ひらがな変換
Space / Tab / ↓	かな漢字変換を開始
Enter	ひらがなのまま確定
Escape	入力をキャンセル
Backspace	1文字削除
Delete	カーソル位置の文字を削除
← →	カーソル移動
Home / End	カーソルを先頭 / 末尾に移動
Ctrl+K	カタカナモードに切り替え
Ctrl+Space	全角スペースを入力

変換モード

キー	動作
Space / Tab / ↓	次の候補
↑	前の候補
1-9	候補を番号で選択・確定
Enter	選択中の候補を確定
Escape	変換をキャンセル（ひらがなに戻る）
文字キー	選択中の候補を確定して新しい入力を開始

モード切り替え

キー	動作
Shift+英字	英数字モードに切り替え + 大文字入力
Ctrl+K	カタカナモードに切り替え
Right Super	英数字/カタカナ → ひらがなモードに復帰
Ctrl+Shift+L	ライブ変換のON/OFF

英数字モード

英数字モードでは文字がローマ字変換されず、そのまま入力されます。日本語と英語を混ぜて入力し、Spaceで変換するとひらがな部分のみ変換されます。

例: わたしはLinuxが → 変換 → 私はLinuxが

Configuration

設定ファイル: ~/.config/karukan-im/config.toml

[conversion]
strategy = "adaptive"           # 変換ストラテジー（adaptive / light / main）
num_candidates = 9              # 変換候補数（Space押下時）
n_threads = 4                   # 推論スレッド数（0 = 全コア使用）
model = "jinen-v1-small-q5"     # メインモデル（モデルID or GGUFパス）
light_model = "jinen-v1-xsmall-q5"  # 軽量モデル（ビームサーチ・長文用）
use_context = true              # Surrounding Textを変換に使用する
max_context_length = 20         # コンテキストの最大文字数
short_input_threshold = 10      # ビームサーチを使うトークン数の上限
beam_width = 3                  # ビーム幅
max_latency_ms = 80             # メインモデルの許容レイテンシ（ms）。超過時は軽量モデルに自動切替（0 = 無効）
dict_path = "/path/to/dict.bin" # システム辞書パス（省略時: ~/.local/share/karukan-im/dict.bin）

[learning]
enabled = true                 # 変換学習の有効/無効
max_entries = 10000            # 学習エントリの最大数

Conversion Strategy

strategy で変換時のモデル使い分けを制御できます。

値	説明	読み込むモデル
`adaptive`	デフォルト。レイテンシに応じてメイン・軽量モデルを動的に切り替え	メイン + 軽量
`light`	軽量モデルのみ使用。メモリ消費が少なく、低スペックPCにおすすめ	軽量のみ
`main`	メインモデルのみ使用（ビームサーチなし）	メインのみ

低スペックのPC（メモリが少ない、CPUが遅い等）では strategy = "light" を設定すると、軽量モデル1つだけで動作するためメモリ使用量が削減され、レスポンスも安定します。

[conversion]
strategy = "light"

Performance Tuning

CPU高負荷時（Rustビルド中など）にかな漢字変換が遅くなる場合は、n_threads を小さくするとレスポンスが改善します。

Dictionary

辞書の構築・管理については karukan-cli の README を参照してください。

System Dictionary

yada double-array trieベースのシステム辞書で、モデル推論に加えて辞書からの変換候補を提供します。

デフォルトパス: ~/.local/share/karukan-im/dict.bin
dict_path で任意のパスを指定可能
ファイルが存在しない場合は辞書なしで動作

ビルド済みの辞書を以下からダウンロードして配置できます:

wget https://github.com/togatoga/karukan/releases/download/v0.1.0/dict.tgz
tar xzf dict.tgz
mkdir -p ~/.local/share/karukan-im
cp dict.bin ~/.local/share/karukan-im/

自分でビルドする場合は karukan-cli の README を参照してください。

User Dictionary

ユーザー辞書ディレクトリにファイルを配置すると、ユーザー辞書として読み込まれます。

デフォルトパス: ~/.local/share/karukan-im/user_dicts/
ディレクトリ内のファイルはすべて自動で読み込み（KRKNバイナリ・Mozc TSV を自動判定）
ディレクトリが存在しない場合はユーザー辞書なしで動作

変換候補の優先順位:

📝 学習キャッシュ
👤 ユーザー辞書
🤖 モデル推論
📚 システム辞書（スコア順）
ひらがな / カタカナ

Learning Cache

ユーザーが選択した変換結果を記憶し、次回以降の変換で優先表示します。

保存先: ~/.local/share/karukan-im/learning.tsv
完全一致と前方一致（予測変換）の両方に対応
- 例: 「早稲田大学」を一度変換すると、次回「わせだ」と入力した時点で候補に表示
学習候補は変換時・入力中（auto-suggest）の両方で最大3件表示
スコアはrecency（最終使用日時）重視 + 頻度補正
IME切り替え・ウィンドウ切り替え時に自動保存（commit のたびには保存しない）
[learning] enabled = false で無効化可能
学習履歴を削除するには: rm ~/.local/share/karukan-im/learning.tsv

Surrounding Text

エディタからカーソル位置周辺のテキストを取得し、変換精度を向上させます。

例えば「虫歯の治療のために」の後に「はいしゃ」を変換すると、文脈から「歯医者」が候補になります。文脈なしでは「廃車」など一般的な候補が優先されます。

Surrounding Textはfcitx5のAPI経由で提供されますが、多くのLinuxアプリケーションでは未対応です（参考: csslayer's blog）。

Note

Surrounding Text周りの挙動は現在調査中です。正しく動作しない場合があります。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

karukan-im

Features

Install

Prerequisites

Build & Install (システムインストール)

Build & Install (ユーザーローカル)

Key Bindings

ひらがな入力モード

変換モード

モード切り替え

英数字モード

Configuration

Conversion Strategy

Performance Tuning

Dictionary

System Dictionary

User Dictionary

Learning Cache

Surrounding Text

FilesExpand file tree

README.md

Latest commit

History

README.md

File metadata and controls

karukan-im

Features

Install

Prerequisites

Build & Install (システムインストール)

Build & Install (ユーザーローカル)

Key Bindings

ひらがな入力モード

変換モード

モード切り替え

英数字モード

Configuration

Conversion Strategy

Performance Tuning

Dictionary

System Dictionary

User Dictionary

Learning Cache

Surrounding Text