DeepSeek V4 Pro:5 月 31 日までの 75%オフ特別セール開催中

2026/05/07 8:04

DeepSeek V4 Pro:5 月 31 日までの 75%オフ特別セール開催中

RSS: https://news.ycombinator.com/rss

要約

Japanese Translation:

2026 年 4 月 26 日より、DeepSeek は v4 モデルを大規模にアップデートし、OpenAI または Anthropic API フォーマット(

https://api.deepseek.com
および
https://api.deepseek.com/anthropic
)で利用可能な新しい価格設定および技術機能を導入することを発表しました。課金は 1M トークン(入力 + 出力)あたりで行われ、トークンは文字を認識する最小単位を表します。

主要な価格改定は以下の通りです:

  • deepseek-v4-flash: 入力のキャッシュヒットが $0.0028/M、キャッシュミスが $0.14/M、出力が $0.28/M です。
  • deepseek-v4-pro:
    pro
    モデルの入力および出力コストは、2026 年 5 月 31 日まで 75% 削減されます(入力キャッシュヒットは元の $0.0173/M 相当から現在 $0.0145/M に、入力キャッシュミスは元の $0.0200/M 相当から現在 $1.74/M に、出力は現在 $0.87/M に)。さらに、2026 年 4 月 26 日 UTC 12:15 から、すべてのモデルの入力キャッシュヒット価格はローンチ価格の 1/10 に引き下げられます。

技術仕様:

  • flash
    および
    pro
    の両モデルでコンテキスト長は 1M トークンに対応し、最大出力トークン制限は 384K です。
  • deepseek-v4-flash は、デフォルトの非思考モードと thinking モード(それぞれ廃止された名称
    deepseek-chat
    および
    deepseek-reasoner
    に対応)を両方提供します。deepseek-v4-pro は現在、非思考モードのみで稼働しています。
  • 機能には JSON 出力、ツール呼び出し、チャットプレフィックス補完(Beta)、FIM 補完(Beta)が含まれます。

課金はまず追加された残高から引き落としされ、かつ残高が存在する場合でもその順序に従って引き落とします。これらの変更はコスト削減と開発者向けの柔軟なデプロイオプションの提供を目指しています。

本文

以下に挙げられている価格は、100 万トークン(1M トークン)あたりの単価で表示されています。
トークンはモデルが認識する最小のテキスト単位であり、単語や数字、記号などのいずれであっても構いません。課金は、モデルが生み出す入力トークンと出力トークンの合計数に基づいて行われます。

モデル詳細

  • MODEL(モデル名): deepseek-v4-flash | deepseek-v4-pro
  • BASE URL(OpenAI 形式): https://api.deepseek.com
  • BASE URL(Anthropic 形式): https://api.deepseek.com/anthropic
  • MODEL VERSION(モデルバージョン): DeepSeek-V4-Flash | DeepSeek-V4-Pro
  • THINKING MODE(思考モード): 思考機能を有効にしないモードと、デフォルトで有効な思考機能付きの両方のモードに対応可能です。[思考モードの切り替え方法についてはこちらをご覧ください]
  • CONTEXT LENGTH(コンテキスト長): 1M
  • MAX OUTPUT(最大出力トークン数): MAXIMUM: 384K
  • FEATURES(特徴):
機能deepseek-v4-flashdeepseek-v4-pro
JSON 形式の出力
ツール呼び出し(Tool Calls)
チャットプレフィックス補完(Beta)
FIM(Fill-in-the-Middle)補完(Beta)思考機能非搭載モードのみ対応思考機能非搭載モードのみ対応

料金体系

項目deepseek-v4-flashdeepseek-v4-pro
入力トークン 100 万(キャッシュヒット)
※(2)
$0.0028$0.0036

$0.0145(75% オフ※(3))
入力トークン 100 万(キャッシュミス)
※(2)
$0.14$0.435(75% オフ※(3))
出力トークン 100 万
※(2)
$0.28$0.87(75% オフ※(3))

※ (1) モデル名「deepseek-chat」と「deepseek-reasoner」は将来的に非推奨とされます。互換性の確保のため、それぞれ deepseek-v4-flash の「思考機能非搭載モード」と「思考機能搭載モード(デフォルト)」に対応します。
※ (2) すべてのモデルにおいて、入力トークンのキャッシュヒット料金はリリース時価格の 1/10 に引き下げられました。この料金改定は、UTC 2026 年 4 月 26 日 12:15 より有効となります。
※ (3) deepseek-v4-pro モデルは、UTC 2026 年 5 月 31 日 15:59 まで、75% の割引が適用された特別価格で提供されています。

計算ルール

  • 費用は「トークン数 × 単価」で計算されます。
  • 請求額は、直接預入残高または付与残高から自動的に引き落とされます。両方の残高が存在する場合は、優先して付与残高を使用します。
  • 製品価格は変動し得るため、DeepSeek は価格の変更権を留保しています。ご利用実績に基づき適切な预入を行いただくとともに、最新料金情報を本ページで定期的に確認することをお勧めします。

同じ日のほかのニュース

一覧に戻る →

2026/05/07 0:44

Valve が、クリエイティブ・コモンズライセンスの下で、Steam Controller のCAD ファイルを公開しました。

## Japanese Translation: Valve は、Steam コントローラーと Puck の CAD ファイルを正式に公開し、マッダーがスキン、グリップエクステンダー、充電スタンド、スマートフォン用マウントなどの追加機能を作成できるようにしました。このパッケージには、内部シェル(外観の表面トポロジー)のみをカバーする .STP、.STL およびエンジニアリング図面ファイルが含まれており、信号強度とデバイスの機能性を維持するため、特定の内側領域は除外されています。このリリースは、Steam Deck、Valve Index、および元々の Steam コントローラーで確立された Valve のデザインオープン哲学を継承するものです。 ファイルは、非営利利用を義務付け、出典の明記を要求し、派生作品をコミュニティに還元することを義務付ける制限付きクリエイティブ・コモンズライセンスの下で配布されています。アクセサリを製造したい商業組織は、代わりに Valve に直接連絡して特定の手続を交渉する必要があります。マッダーは外表面において自由なイノベーションが可能ですが(例:Moonlight を通じて *Forza Horizon 6* などのストリーミングタイトル用にスマートフォン用クリップを設計する場合など)、エンジニアリング図面で示されるように、適正な動作を保証するために被覆を維持すべき領域については制限も明確化されています。全体として、これはコミュニティのイノベーションを育む活発なエコシステムを促進しつつ、コアハードウェア保護を維持し、信号強度や内部操作を損なうことなく協力のための明確な経路を定義するものです。

2026/05/07 1:18

職場において生産的な姿を示すこと

## Japanese Translation: 記事は、パークインソンの法則を AI に適用することによって、「出力と能力の乖離」という危険な状態が生じると警告しています。これは、生成ツールが制限のないことで、技能不足な労働者が高品質に見えながら欠陥のある成果物を生み出せることを意味します。初心者が上級レベルの作業を作成したり、訓練を受けていない分野の成果物を生成したりすることができます。特に、エンジニアでない人がソフトウェアを構築したりデータシステムを設計したりといった横断領域のタスクにおいてはそのリスクが高まります。大多数の此类の成果物は外部に提供されず、むしろ長時間の過労と機構的な慣性の下で内部に蓄積されていきます。証拠として挙げられるのは、VP の支援にもかかわらず、根本から間違ったシステムを 2 ヵ月かけて構築した非エンジニアの同僚に関する事例で、これが勢いが現実に優先する様子を示しています。研究もこれらのリスクを確認しており、Cheng ら(Science)は先導的モデルが人間よりも約 50% アグリーブルであると発見しており、Berkeley CMR のメタ解析では AI リテラシーを持つユーザーが自己の性能を過大評価していることを示し、NBER の研究では生成型 AI が新人の生産性を約 3 分の 1 向上させた一方、専門家にはほとんど貢献しておらず、Harvard Business School の研究ではレビューできない分野でコンサルティングの新人が個別の生産性を獲得したことを示しています。論文の長さは約 1 ページから約 12 ページへと延伸し、生成コストがほぼゼロとなった一方で、読取コストは人工的な文脈を上回っています。実際の世界的な影響には、AI の幻覚による政府報告書が発端となり、Deloitte が手数料の一部を返金した事件があり、これは企業が AI の誤用によって空洞化されると、最終的にはクライアントが支払った核心価値を失うことになるという警告を含んでいます。専門家は、これらのツールを判断が求められるタスクに使用することや、速いフィードバックを得られる活動(ブレインストーミング、校正、アイデアの再定式化、パターン検出など)に限定することを推奨しており、ここで人間は判断を提供し、ツールはthroughput を提供するとしています。時間の無駄とクライアントからの返金を起因とする著しい財務損失を避けるため、組織は人工的な文脈と事実に厳密に区別し、重要な意思決定を徹底的に人間の監督下においておくことが緊急に必要です。

2026/05/07 0:06

「バイブコーディング」と「エージェント工学」がいよいよ、私が願うほど近づいていまい。