朝起きたら、Airbnbチャットに3枚の画像が届いてた。
パスポート2枚+在留カード1枚。前日に送った「残り4人分のIDお願いします🙏」リマインドが効いたみたいです。
「ありがてぇ……」と思ったのも束の間、次の地獄が待ってました。
画像から名簿スプレッドシートに、手入力で40項目書き写す作業。
そこで救世主として登場したのが、Googleの AI Gemini。今日はその話。手入力地獄から解放された30秒の革命を、笑い多めで書いていきます。

またAIに頼った話か。

今日のはマジで革命的やってん、聞いてくれ。

はいはい。…まぁ朝から興奮しとるしな、聞いたるわ。
🎭 前回のあらすじ:チェックイン3時間前、ゲスト名簿ゼロ件
民泊ホスト1年目、ある朝のドタバタを書いた前回の記事。
- 当日17時から外国籍5名グループがチェックイン
- でも宿泊者名簿の提出、ゼロ件
- 特区民泊では宿泊者全員のパスポート情報を集めて保管するのが法律で義務
- 残り時間、約3時間
→ AIにリマインド文を作ってもらってAirbnbで送信、なんとか凌いだ……というところまでが前回のお話。

あれ結局どうなったん?

それを今から書こうとしてるんやって。

早よせえ。
そして翌朝。Airbnbチャットを開くと、ピロンと3枚の画像通知が来てた。
📸 4/5名分のIDが揃った…「揃ったでぇ!」と喜んだ次の瞬間
届いてた画像の内訳:
- パスポート画像 ×2枚(2人分)
- 在留カード画像 ×1枚(日本在住の方)
+ ご本人の分(前日提出済み)= 4/5 達成!

在留カードでもいけるの?

日本在住の外国籍ゲストは、パスポートやのうて在留カードでもOKやねん。法律ベースの判定や。

意外と柔軟なんやな。

そう、日本の民泊法、こういうところは融通利くんやで。
「ふぅ、これでチェックイン受け入れられる」と一安心──したのも束の間。
ここから宿泊者名簿スプレッドシートに転記する作業が待ってます。
😱 1人あたり10項目 × 4人 = 40項目を手入力?
宿泊者名簿に必要な項目はこれ全部:
| # | 項目 | 例 |
|---|---|---|
| 1 | 氏名 | DELA CRUZ JUAN |
| 2 | パスポート/在留カード番号 | P1234567A |
| 3 | 国籍 | フィリピン |
| 4 | 性別 | 男 / 女 |
| 5 | 生年月日 | 1990-05-15 |
| 6 | 発行日 | 2020-03-01 |
| 7 | 有効期限 | 2030-04-30 |
| 8 | 住所 | Manila, Philippines |
| 9 | 出生地 | Quezon City |
| 10 | 発行機関 | DFA Manila |
10項目 × 4人分 = 40項目。
しかもパスポートにはローマ字の名前と数字がびっしり並んでて、目を凝らして1文字ずつ書き写すしかない。

誰が好きでこんな作業やんねん。

今までは……ワイがやってた……。

何回くらい?

……数えたない……。
民泊1年目、毎月数件のチェックインのたびに、深夜にこれをやってきた。気絶しそうになる作業でした。
💡 そこで思い出した:「画像読ませたらAIが構造化してくれるやん」
最近、テック界隈で 「マルチモーダル」 っていう単語をよく聞くようになりました。

また横文字や。マルチって何や、人増えるんか?

わかる、わかる。ワイも完璧わかってへん。要は「画像も文章も同時に読めるAI」と思てもろうたらええ。

それ、人間と一緒やん。

今までのAIは文章しか読めへんかったから、人間に追いついたって感じや。
その代表格が Google の Gemini(ジェミニ)。試しにパスポート画像を1枚投げて、日本語でこう頼んでみました:
このパスポート画像を読み取って、氏名・番号・国籍・生年月日・性別・有効期限を JSON 形式で返して。
数秒待つと、こんな結果が返ってきた:
{
"surname": "DELA CRUZ",
"given_names": "JUAN",
"passport_number": "P1234567A",
"nationality": "PHL",
"date_of_birth": "1990-05-15",
"sex": "M",
"date_of_expiry": "2030-04-30"
}

これ何や、また呪文出てきた。

これな、スプレッドシートにそのまま貼り付けられる形やねん。手入力ゼロで完成や。

……マジで?

マジで。30秒で済んだ。

なんで今まで気づかへんかったんや!

マルチモーダルAIが実用レベルになったの、ホンマここ最近やねん…許してくれ…。
🆚 試しに3つのAIで精度比較してみた
ワイは普段 Claude・ChatGPT・Gemini の3つを使い分けてます。同じパスポート画像を3つに投げて、精度比較してみました。
| AI | 精度 | 速度 | コメント |
|---|---|---|---|
| Gemini | ◎ 完璧 | ◎ 数秒 | 画像の中の細かい数字も正確 |
| Claude | ◎ 完璧 | ○ 普通 | 精度は同等、たまに混みすぎな日は遅い |
| ChatGPT | ○ 90点 | ○ 普通 | 在留資格区分の解釈で時々ブレる |

てか、3つ全部使い分けてるんかい。AIマニアやろ。

仕事の道具や。家にトンカチもドライバーもネジ回しもあるやろ?それと一緒や。

例え強引やな。
今回みたいに画像読ませる作業は、Geminiが一歩抜きん出た印象でした。
💎 Gemini が民泊ホストに刺さる3つの理由
1. マルチモーダルの精度
パスポートと在留カード、フォーマット違っても必要項目をちゃんと抜き出してくれます。日本語表記の在留カードも、ローマ字表記のパスポートも、両方OK。
2. 処理速度
1枚あたり数秒。5人分なら30秒で全員分の構造化データが手に入る。
3. コストが激安
画像1枚あたり数円〜数十円程度。月50件処理しても数百円。深夜にやってた手入力作業の代替としては、コスパが破壊的に良い。

その値段でやってくれるなら、もう人間が手入力する理由ないやん。

せやろ?せやから今回ワイ、震えながら使った。
🛠 次の野望:「画像をフォルダに入れたら自動でCSV」
理想形:新しいパスポート画像が届いたら、フォルダにポイ→名簿が完成するフロー。
イメージはこんな感じ:
[Airbnbチャットの画像をDLに保存]
↓
[フォルダに放り込むだけ]
↓
[自動スクリプトが Gemini に画像を投げる]
↓
[JSONが返ってくる → CSV変換]
↓
[名簿スプレッドシートに自動投入]
このフロー、いま絶賛開発中の「宿泊名簿管理アプリ(guest-registry)」に組み込む予定です。完成したらまた別記事で紹介します。

また自前でアプリ作ってる!

AIに頼んだら、ノーコードでアプリ試作できる時代やからな。

その「AIに頼んだら」が口癖やね、最近。

1年やって出した結論や、もう手放せへん。
📌 まとめ
- 民泊運営で大変なのは 「ゲスト名簿の手入力地獄」。1人10項目 × 4人 = 40項目はマジで無理ゲー
- Gemini Vision に画像を投げると、30秒で全員分のデータがJSON化される
- マルチモーダルAI(画像も読めるAI)の代表は Claude・Gemini・ChatGPT の3兄弟。今回は Gemini が一歩リード
- パスポートでも在留カードでもフォーマット違っても、AIが賢く読んでくれる
- コストは画像1枚あたり数円〜数十円。深夜の手入力地獄から解放される値段としては破格
- 完璧を目指さず「最低限の項目だけJSON化」が現実解。完璧主義は自分を殺す
- 次の野望:フォルダ→自動CSV化のフロー。今、自前のアプリに組み込み中
民泊1年目、こうやって毎日違う雑務に襲われます。でも、AIが横にいてくれるなら、深夜の作業も30秒に短縮できる。本業もある中で、これが現実です。
めんどくさい手作業は、ぜんぶAIに食わせろ。
これが民泊1年目で出した、ワイの結論です。

…結局AIに頼ってばっかりやな。

人間がやらなアカン仕事だけ残るのが、一番幸せなパターンやで。

ほな、今日もよろしゅうにジェミニさん。

おう。お賃金、月に数百円な。




