職務申請でSATのスコアを求められた

2026/06/23 5:55

職務申請でSATのスコアを求められた

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

本テキストは、履歴書が AI 生成コンテンツやキーワード最適化で飽和するに伴い、テクノロジー分野の採用プロセスを証拠に基づいた評価方法に戻さなければならないと論じます。歴史的に、企業たちは 2023 年頃までに学位要件からの移行を行いましたが、この変化には生来の能力に対する同等に信頼性の高い指標が伴っていませんでした。研究は第一次世界大戦(陸軍アルファ/ベータ)と 1950 年代半ば(AT&T の評価センター)までさかのぼり、認知能力検査が強力な予測因子であることを確立しています。しかしながら、最近の研究では構造化されたインタビューと実務サンプルの方が、認知能力検査単独よりもはるかに高い予測有効性を提供することを示唆しています。一方、Google のラズロ・バック氏や「塩のテスト」や難問を用いたエディス氏が批判する gibi主観的な手法である頭を使うパズルは、現在では仕事を成功に結びつける予測において失敗する混乱を招く謎のように increasingly 見なされています。トニー・シェイ氏のシャトルテストや特定のスタートアップが SAT のスコアを要求するという具体的な逸話などは、評価試みの多様性を浮き彫りにしています。AI によって容易に操作される書式化された申請書を扱う現在の状況に対応するため、本テキストは AI 耐性のある代替手段の採用を提案しています:タイマー付きの実施演習、口頭で擁護が必要な監視下での自宅作業、対面でのホワイトボーディング、営業ロールプレイなどです。これらの手法は実証されたスキルを直接検証し、組織のリソースを節約するとともに、一般的なコンテンツや知識よりも真の可能性を重視するより公正なプロセスを確保します。

本文

2026 年、ETL スタートアップが SAT スコアを要求する理由と採用手法の進化について

2026 年 6 月 20 日、Y Combinator(YC)の求人リストを確認した際、私の住む地域の小規模スタートアップから興味深い求人が目につきました。完全リモートへの不満は感じていなかったものの、ハイブリッド勤務体制への関心があり、そこで「GTM(市場展開担当)」という未詳な職務範囲と魅力的な ETL ツール製品の記述に期待を抱いていました。

しかし、募集要項の末尾にある一句で事態は急転しました。

私の SAT のスコアを教えてください

この「数十年も前のテストスコア」を現代採用プロセスに求める動きには、二つの点が強く関心を惹きました。

  • 学士号必須要件の減少: 2023 年以降、テック企業では学位より**「趣味プロジェクトの実績」「個人ウェブサイト」「情熱と自律性の示唆」**といった指標が重視されるようになっています。
  • 意味不明な自己申告スコア: 認知能力の測定という正当性が不明確なまま、過去且つ確認不可なデータを採用判断材料にするのは、単なる**「指示への服従を問うトリック」**に過ぎないと考えられます。

採用評価の歴史的背景

現代の採用評価手法は、科学として確立されたものではありません。軍事史心理学の応用がベースにあります。

  • 第一次世界大戦と Army Alpha/Beta (1917)

    • ロバート・ヤーケスによる開発。
    • 150 万人以上の兵士を短期間で配置する必要性から面接は不可能でした。
    • Army Alpha: 識字者向けテスト。
    • Army Beta: 非識字者または言語不通者向け(ノンバーバル形式)。
    • これらが集団実施型認知テストの起源となりました。
  • アセスメントセンター(当初はスパイ選抜向け)

    • ヘンリー・マラッهی氏が発案。荘厳な屋敷での 3 日間プログラム、シミュレーション、複数評価者による査定。
    • 1950 年代半ば、AT&T が将来の成功と相関があることを縦断調査で確認しました。

最も効果的とされる採用手法

完全な完璧さは存在しないものの、以下の組み合わせが将来の専門的成功を予測する上でエビデンスが最も強力です。

1. 構造化面接(トップクラス)

  • サケットらの研究 (2022): 認知テストより**「構造化面接」の方が職務パフォーマンスを強く予測**。
  • 要件: 統一された質問、明確な採点基準、訓練された面接官。
  • 限界: 信頼区間が 80% であり、面接官の質と基準の整合性に依存します。

2. 職務サンプルテストおよび知識テスト(ゴールドスタンダード)

  • 自宅課題や試用期間での実際の業務遂行。
  • 「実際にできるか」を直感的に確認でき、過去には構造化面接との併用が最強と見なされていました。
  • AI 時代以前における**「会話による人物像理解」+「構造化による客観比較」+「職務課題による実力確認」**の三角関係が理想でした。

3. 認知能力テスト

  • 依然として強い予測力ですが、最強ではありません。
  • 学習負荷が高い職種で有用ですが、既存経験が多い応募者には相対的に有効性が低下します。

4. アセスメントセンター

  • 管理能力予測に優れますが、コストと時間がかかりすぎて現実的ではありません(スパイ選抜のように)。

効果が低いまたは危険な手法

以下の手法は科学的根拠が乏しく、バイアスや誤判断のリスクが高いです。

手法問題点・限界
非構造化面接(雑談)印象操作、ハロ効果、同好性バイアスに弱く、Google の調査では評価と実績に相関なし
性格分類(MBTI など)採用判断にはほぼ役に立たない。
筆跡分析科学的根拠不足。
エジソンのトリビアテスト (1921)知識と実力を混同し、特定の誤答を正解とする奇妙な設計。
塩テストスープに塩を注ぐ順序で即不合格とし、行動の前提判断しか測らない。

「愚かな頭脳パズル」と極端な選抜手法

マイクロソフトや Google が流行らせた「マンホール蓋はなぜ丸いのか?」などのパズルも、HR 専門家であるラスロ・ボック氏は**「時間の無駄で面接官を賢く見せるための演出」**として批判しています。

さらにザップス創業者のトニー・ヒージ氏は以下のような過激な手法を採用しました。

  • 空港スクリーン: 自社の機で候補者を運ぶ際、ドライバーから扱いを評価され「不快なら即却下」。
  • オファー (Offer): $100(後には$3,000)を提供して即退職を提案。「勝負する人か、単にお金を得たい人か」を見極める試み。

AI 時代における採用のジレンマ

今回の ETL スタートアップのケースは、AI の普及により従来の評価手法が難しくなった現れかもしれません。

  • 履歴書の均質化: AI ツールを使用すれば、誰でも完璧な「力強いジャーナリスト調」のカバーレターや最適化された履歴書を作成可能に。
  • 「生の知能」の評価困難さ: 生成 AI が存在する前のような標準化されたテストへの依存も増し、人間としての原動力(Raw Horsepower)を見極めることが難しくなっています。

AI を使わないで「生きた頭脳」を検出したいという欲求から、この奇妙な SAT スコアの要求が行われた可能性があります。しかし、もしこれが業界標準へ移行すれば、以下の代替案が有効です。

AI 時代への適応策(推奨手法)

  • 制限付き・ライブ演習:
    • オフアイスまたはハイブリッドで対面を優先。リモート時は遠隔監督者か現地社員による監視。
    • コンピュータ画面越しでは、Claude など AI に答えさせ暗唱する候補者が判別しにくい。
  • 自宅課題+ライブ質疑応答:
    • 提出物の後、作品内容について議論。「AI が作ったものを理解しているか」を即座に問う。
  • ホワイトボード演習の復活:
    • パンとペンでの対面演習に戻り、思考プロセスそのものを観察。
  • 営業職向け:ライブロールプレイ:
    • 実戦的な対応力をリアルタイムで評価。

私の見解

最近の採用では、特定の質問後に複数の候補者が横に視線を固定し、「AI に答えさせ暗唱している」様子が確認されています。メモを見ていることもありますが、これらをすべて容認するのは適切ではありません。

未来の成功を予測する最も優れた指標は、**「検証可能」「最新」「相対的に制御された」評価であるはずです。そのため、私たちは再び「紙とペンを使った、対面監督付きテスト」**へと回帰せざるを得ないのかもしれません。

同じ日のほかのニュース

一覧に戻る →

2026/06/23 2:09

Steam マシンが本日発売開始

## Japanese Translation: このフッターセクションは、Valve Corporation からの法的通知であり、コンテンツに対する留保された権利を主張するとともに、商標が世界中でそれぞれの所有者に帰属することを示しています。これは厳格な知的財産権の境界線を定め、プライバシーポリシー、アクセシビリティ基準、Steam サブスクライバー契約、返金手続き、クッキー情報を含む重要なポリシーへのアクセスを案内します。これらの契約的および法的枠組みを確立することで、本テキストはユーザーが自身のデータ権利、返金の有無、利用条件について理解できるよう通知し、企業資産と国際的・地域的な合意に基づく消費者保護に関する明確さを確保しています。

2026/06/23 5:48

LG スマート TVs の約半分が住宅用プロキシ SDK を内蔵しています

## Japanese Translation: LG webOS および Samsung Tizen TV 向けに導入されている 6,038 アプリについて調査したところ、そのうち 2,058 を超えるアプリが SDK(ソフトウェア開発キット)を介して静かにユーザーの IP アドレスを販売し、レジデンシャルプロキシとして機能することが明らかとなりました。従来の広告ベースの収益化モデルとは異なり、これらのアプリはスクリーンセーバーや水槽などの distractions なユーティリティ内に偽装された SDK を通じて、インターネット接続を静かに収益化しています。Amazon は明確に此类サービスを禁止しているほか、Roku も接触後に同様の SDK をブロックしたと報じられていますが、LG および Samsung では同様の公的ポリシーが存在せず、このビジネスモデルが検出されずに拡大することを許容する規制上の空白を生み出しています。特定企業のうち、Bright Data(367 件のフラグ付けされたアプリに関連)および Honeygain UAB(16 件のアプリの発行元)が含まれています。単なるデータ共有を超えた深刻なセキュリティリスクが存在します。一部の SDK はプライベート IP の範囲に対する適切なブロックリストを欠いており、その結果 TV が攻撃者のローカルデバイス(ルーターやカメラなど)へのアクセス手段となる可能性があります。これは Kimwolf ボットネットの事例で実証されています。提供者は同意フロー、KYC、監査などがリスクを軽減すると主張していますが、ユーザーがこれらの統制を検証するのは困難です。このため、研究者たちは、LG および Samsung に顕著な開示とユーザークントロールを要件とする明確なポリシーの確立を促しており、これによってこの目に見えない経済活動が検出されずに続かないよう求めています。

2026/06/23 6:21

Unsloth GLM-5.2 — ローカルで実行する方法

## Japanese Translation: Z.ai の GLM-5.2 は、40B(アクティブ)のパラメータを備えた 7440 億パラメータを持つ大規模オープンソースモデルであり、コーディング、推論、エージェントタスクにおいて GPT-5.5 や Claude 4.8 Opus などの主要なクローズドモデルと同等の最先端性能を発揮します。大きな進歩の一つは、Unsloth の Dynamic quantization を用いて標準ハードウェアでローカル実行可能な点であり、例えば推奨されている 2 ビットバージョン(UD-IQ2_M)では、必要な容量が 1.51TB からわずか 239GB に削減されつつ約 82% の上位 1% の精度を維持し、高メモリワークステーションや 256GB ユニファイドメモリの Mac、GPU オフロードを利用するシステムなどで動作します。また、「Non」「High」「Max」の 3 つの思考モードを Unsloth Studio インターフェースまたはコマンドラインからアクセスでき、必要に応じて推論深度を切り替え可能です。MacOS、Windows、Linux のすべてで動作し、Unsloth Studio や llama.cpp を通じて高速な推論を実行できます。さらに、KV キャッシュの quantization による最多 3.5 倍までのコンテキスト長延伸や、クラウド API に依存せず迅速なローカル展開を可能とする柔軟なインストールスクリプトなどの追加最適化も提供されます。