Japanese Translation:

本テキストは、履歴書が AI 生成コンテンツやキーワード最適化で飽和するに伴い、テクノロジー分野の採用プロセスを証拠に基づいた評価方法に戻さなければならないと論じます。歴史的に、企業たちは 2023 年頃までに学位要件からの移行を行いましたが、この変化には生来の能力に対する同等に信頼性の高い指標が伴っていませんでした。研究は第一次世界大戦（陸軍アルファ/ベータ）と 1950 年代半ば（AT&T の評価センター）までさかのぼり、認知能力検査が強力な予測因子であることを確立しています。しかしながら、最近の研究では構造化されたインタビューと実務サンプルの方が、認知能力検査単独よりもはるかに高い予測有効性を提供することを示唆しています。一方、Google のラズロ・バック氏や「塩のテスト」や難問を用いたエディス氏が批判する gibi主観的な手法である頭を使うパズルは、現在では仕事を成功に結びつける予測において失敗する混乱を招く謎のように increasingly 見なされています。トニー・シェイ氏のシャトルテストや特定のスタートアップが SAT のスコアを要求するという具体的な逸話などは、評価試みの多様性を浮き彫りにしています。AI によって容易に操作される書式化された申請書を扱う現在の状況に対応するため、本テキストは AI 耐性のある代替手段の採用を提案しています：タイマー付きの実施演習、口頭で擁護が必要な監視下での自宅作業、対面でのホワイトボーディング、営業ロールプレイなどです。これらの手法は実証されたスキルを直接検証し、組織のリソースを節約するとともに、一般的なコンテンツや知識よりも真の可能性を重視するより公正なプロセスを確保します。

2026 年、ETL スタートアップが SAT スコアを要求する理由と採用手法の進化について

2026 年 6 月 20 日、Y Combinator（YC）の求人リストを確認した際、私の住む地域の小規模スタートアップから興味深い求人が目につきました。完全リモートへの不満は感じていなかったものの、ハイブリッド勤務体制への関心があり、そこで「GTM（市場展開担当）」という未詳な職務範囲と魅力的な ETL ツール製品の記述に期待を抱いていました。

しかし、募集要項の末尾にある一句で事態は急転しました。

「私の SAT のスコアを教えてください」

この「数十年も前のテストスコア」を現代採用プロセスに求める動きには、二つの点が強く関心を惹きました。

学士号必須要件の減少: 2023 年以降、テック企業では学位より**「趣味プロジェクトの実績」「個人ウェブサイト」「情熱と自律性の示唆」**といった指標が重視されるようになっています。
意味不明な自己申告スコア: 認知能力の測定という正当性が不明確なまま、過去且つ確認不可なデータを採用判断材料にするのは、単なる**「指示への服従を問うトリック」**に過ぎないと考えられます。

採用評価の歴史的背景

現代の採用評価手法は、科学として確立されたものではありません。軍事史と心理学の応用がベースにあります。

第一次世界大戦と Army Alpha/Beta (1917)
- ロバート・ヤーケスによる開発。
- 150 万人以上の兵士を短期間で配置する必要性から面接は不可能でした。
- Army Alpha: 識字者向けテスト。
- Army Beta: 非識字者または言語不通者向け（ノンバーバル形式）。
- これらが集団実施型認知テストの起源となりました。
アセスメントセンター（当初はスパイ選抜向け）
- ヘンリー・マラッهی氏が発案。荘厳な屋敷での 3 日間プログラム、シミュレーション、複数評価者による査定。
- 1950 年代半ば、AT&T が将来の成功と相関があることを縦断調査で確認しました。

最も効果的とされる採用手法

完全な完璧さは存在しないものの、以下の組み合わせが将来の専門的成功を予測する上でエビデンスが最も強力です。

1. 構造化面接（トップクラス）

サケットらの研究 (2022): 認知テストより**「構造化面接」の方が職務パフォーマンスを強く予測**。
要件: 統一された質問、明確な採点基準、訓練された面接官。
限界: 信頼区間が 80% であり、面接官の質と基準の整合性に依存します。

2. 職務サンプルテストおよび知識テスト（ゴールドスタンダード）

自宅課題や試用期間での実際の業務遂行。
「実際にできるか」を直感的に確認でき、過去には構造化面接との併用が最強と見なされていました。
AI 時代以前における**「会話による人物像理解」＋「構造化による客観比較」＋「職務課題による実力確認」**の三角関係が理想でした。

3. 認知能力テスト

依然として強い予測力ですが、最強ではありません。
学習負荷が高い職種で有用ですが、既存経験が多い応募者には相対的に有効性が低下します。

4. アセスメントセンター

管理能力予測に優れますが、コストと時間がかかりすぎて現実的ではありません（スパイ選抜のように）。

効果が低いまたは危険な手法

以下の手法は科学的根拠が乏しく、バイアスや誤判断のリスクが高いです。

手法	問題点・限界
非構造化面接（雑談）	印象操作、ハロ効果、同好性バイアスに弱く、Google の調査では評価と実績に相関なし。
性格分類（MBTI など）	採用判断にはほぼ役に立たない。
筆跡分析	科学的根拠不足。
エジソンのトリビアテスト (1921)	知識と実力を混同し、特定の誤答を正解とする奇妙な設計。
塩テスト	スープに塩を注ぐ順序で即不合格とし、行動の前提判断しか測らない。

「愚かな頭脳パズル」と極端な選抜手法

マイクロソフトや Google が流行らせた「マンホール蓋はなぜ丸いのか？」などのパズルも、HR 専門家であるラスロ・ボック氏は**「時間の無駄で面接官を賢く見せるための演出」**として批判しています。

さらにザップス創業者のトニー・ヒージ氏は以下のような過激な手法を採用しました。

空港スクリーン: 自社の機で候補者を運ぶ際、ドライバーから扱いを評価され「不快なら即却下」。
オファー (Offer): $100（後には$3,000）を提供して即退職を提案。「勝負する人か、単にお金を得たい人か」を見極める試み。

AI 時代における採用のジレンマ

今回の ETL スタートアップのケースは、AI の普及により従来の評価手法が難しくなった現れかもしれません。

履歴書の均質化: AI ツールを使用すれば、誰でも完璧な「力強いジャーナリスト調」のカバーレターや最適化された履歴書を作成可能に。
「生の知能」の評価困難さ: 生成 AI が存在する前のような標準化されたテストへの依存も増し、人間としての原動力（Raw Horsepower）を見極めることが難しくなっています。

AI を使わないで「生きた頭脳」を検出したいという欲求から、この奇妙な SAT スコアの要求が行われた可能性があります。しかし、もしこれが業界標準へ移行すれば、以下の代替案が有効です。

AI 時代への適応策（推奨手法）

制限付き・ライブ演習:
- オフアイスまたはハイブリッドで対面を優先。リモート時は遠隔監督者か現地社員による監視。
- コンピュータ画面越しでは、Claude など AI に答えさせ暗唱する候補者が判別しにくい。
自宅課題＋ライブ質疑応答:
- 提出物の後、作品内容について議論。「AI が作ったものを理解しているか」を即座に問う。
ホワイトボード演習の復活:
- パンとペンでの対面演習に戻り、思考プロセスそのものを観察。
営業職向け：ライブロールプレイ:
- 実戦的な対応力をリアルタイムで評価。

私の見解

最近の採用では、特定の質問後に複数の候補者が横に視線を固定し、「AI に答えさせ暗唱している」様子が確認されています。メモを見ていることもありますが、これらをすべて容認するのは適切ではありません。

未来の成功を予測する最も優れた指標は、**「検証可能」「最新」「相対的に制御された」評価であるはずです。そのため、私たちは再び「紙とペンを使った、対面監督付きテスト」**へと回帰せざるを得ないのかもしれません。

職務申請でSATのスコアを求められた