ビデオ圧縮の仕組み: なぜあなたの4Kファイルは200GBなのか
あなたは電話やカメラで10分間の4Kビデオを録画し終え、ファイルサイズを確認すると、唖然とします: 200GB。 一方、Netflixでの2時間の4K映画は、合計で約15GBでスムーズにストリーミングされています。 これはどういうことですか?
💡 主なポイント
- 生の真実: 非圧縮ビデオの実際の姿
- 空間圧縮と時間圧縮: 二つの柱
- コーデックの解析: H.264, H.265, VP9, および AV1
- ビットレート: すべてを制御するつまみ
答えはビデオ圧縮にあります。この技術は現代のデジタル生活にとって極めて重要であり、これがなければYouTubeは存在せず、ビデオ通話は不可能で、あなたの電話のストレージは約90秒の映像を録画した後には満杯になってしまいます。それでも、毎日ビデオを扱っているほとんどの人は、実際に何が起こっているのかを理解していません。
これは表面的な解説ではありません。私たちはビデオ圧縮のメカニズム、重要なトレードオフ、そしてあなたのワークフローが時間とストレージの両方を無駄にしている可能性が高い理由について深く掘り下げていきます。あなたが開発者でビデオ機能を構築している場合、デザイナーでモーショングラフィックスをエクスポートしている場合、あるいはマーケティング担当者としてランディングページのビデオが読み込むのに時間がかかる理由を理解しようと取り組んでいるなら、このガイドはあなたのビデオファイルに対する考え方を変えるでしょう。
生の真実: 非圧縮ビデオの実際の姿
圧縮について話す前に、私たちが何を圧縮しているのかを理解する必要があります。生の非圧縮ビデオは非常に大きく、各フレーム内のすべてのピクセルの完全な情報を保存します。
30フレーム毎秒の4Kビデオの計算をしてみましょう。4K解像度は3840 × 2160ピクセルで、1フレームあたり8,294,400ピクセルに相当します。各ピクセルは通常、24ビット(赤、緑、青それぞれ8ビット)の色情報を保存します。つまり、1ピクセルあたり3バイトです。
したがって、1フレームの4Kビデオ = 8,294,400ピクセル × 3バイト = 24,883,200バイト、つまり1フレームあたり約23.7 MBです。30フレーム毎秒では、1秒間に711 MBのビデオデータになります。10分のビデオは約427GBの生データになります。
これが、あなたの200GBのファイルが大きい一方で、実際にはすでにある程度圧縮されている理由です—おそらくカメラの録画中に適用された軽量コーデックを使用しています。RAW形式で撮影されたプロの映画用カメラは、ポストプロダクションのカラーグレーディングやエフェクト作業のために最大の画像品質を保持しているため、このサイズ範囲のファイルを生成することがよくあります。
「ビデオ圧縮の根本的な課題は、人間の知覚が動きや詳細を検出するのに非常に洗練されている一方で、特定の情報損失に対して驚くほど寛容であるという事実です。この分野は、私たちが見ることができるものと実際に見る必要があるものとの間のギャップに存在します。」
ストレージの要件は、高いフレームレートを考慮するとさらにばかげたものになります。60fpsや120fpsでのゲームコンテンツは、これらの数字を2倍または4倍にします。これが、ゲームキャプチャとストリーミングが技術的に要求される分野である理由です—あなたは視覚的品質を維持しながら、リアルタイムで膨大なデータを圧縮しようとしているのです。
これらの基本的な数値を理解することは重要です。なぜなら、それらがすべての事情を文脈に置くからです。誰かが、元のサイズの1%に圧縮したビデオがあると言った場合、それは誇張ではありません。現代のビデオ圧縮は、視聴者が優れた品質と認識するものを維持しながら、実際に100:1の圧縮比を達成しているのです。
空間圧縮と時間圧縮: 二つの柱
ビデオ圧縮は、空間圧縮(個々のフレーム内)と時間圧縮(フレーム間)の二つの基本軸で機能します。この区別を理解することは、さまざまな種類のコンテンツが異なるように圧縮される理由を graspするために不可欠です。
空間圧縮は、各ビデオフレームを静止画像のように扱い、JPEG圧縮に似た技術を適用します。単一フレーム内のパターン—似た色の領域、グラデーション、テクスチャ—を探して、それらをより効率的に表現します。青い空がフレームの半分を占めている場合、空間圧縮は「青いピクセル、青いピクセル、青いピクセル」を何百万回も保存するのではなく、「この領域は青い」と言って、情報を一度だけ保存します。
これが、トーキングヘッドビデオが非常に良く圧縮される理由です。背景は静的または単純であり、人物の服や肌の色も大きな同様の色の領域を作り出します。コーポレートインタビューのビデオは、目に見える品質損失を最小限に抑えながら、その生のサイズの5%まで圧縮されることがあります。
時間圧縮は、ビデオ圧縮が非常に興味深く、非常に効果的になるところです。連続したビデオフレームは通常非常に似ているという事実を利用します。典型的なビデオでは、90-95%のピクセルは一つのフレームから次のフレームに変わりません。その冗長な情報をすべて保存する必要がありますか?
現代のコーデックは、キーフレーム(I-フレーム)と予測フレーム(P-フレームとB-フレーム)のシステムを使用します。キーフレームは、空間圧縮だけで保存された完全なフレームです。それに続くフレームを完全に保存する代わりに、コーデックはキーフレームから変わった部分だけを保存します。誰かが話していて、その人の口だけが動いている場合、次のフレームでは口の領域のデータだけを保存することが必要です。
B-フレーム(双方向フレーム)はさらに洗練されています—彼らは前のフレームと未来のフレームの両方を参照して内容を予測することができます。これが、ビデオエンコーディングが瞬時でない理由です; エンコーダは最適な保存情報と予測情報を決定するために、同時に複数のフレームを分析する必要があります。
| フレームタイプ | 圧縮比 | エンコードコスト | ユースケース |
|---|---|---|---|
| I-フレーム(キーフレーム) | 最低(典型7:1) | 低 | シーンの変化、シークポイント |
| P-フレーム(予測) | 中(典型20:1) | 中 | 前のフレームからの前方予測 |
| B-フレーム(双方向) | 最高(典型50:1) | 高 | キーフレーム間の最大圧縮 |
これらのフレームタイプの比率は、ファイルサイズとエンコード時間の両方に大きく影響します。キーフレームが10フレームごとにあるビデオは大きくなりますが、スクラブや編集がしやすくなります。キーフレームが250フレームごとにあるビデオははるかに小さくなりますが、正確なシークが難しく、デコードコストも高くなります。
これが、動きの多いスクリーンレコーディング(ゲーム映像など)が静的なスクリーンキャプチャよりもはるかに大きい理由です。フレーム全体が16ミリ秒ごとに変わると、時間圧縮は何も利用できません。コーデックは、ほぼすべてのフレームをキーフレームとして扱わざるを得ず、ビデオ圧縮が機能する効率のほとんどを失います。
コーデックの解析: H.264, H.265, VP9, および AV1
コーデック(圧縮・解凍装置)は、実際に圧縮を実行するアルゴリズムです。コーデックの風景はこの20年間で劇的に進化しており、適切なコーデックの選択は、ファイルサイズと品質に影響を与える最も重要な決定事項の一つです。
H.264(AVCとも呼ばれます)は、2000年代中頃からインターネットビデオの主力です。それは長年YouTubeで使用されてきたものであり、ほとんどのカメラが録画する際に使うもので、実質的にすべてのデバイスがデコード可能です。H.264は、典型的なコンテンツに対して約1000:1の圧縮比を達成しながら、良好な視覚品質を維持しています。427GBの生データであった10分間の4Kビデオは、適切な品質設定でH.264に圧縮すると400-600MBになることがあります。
H.264の普及は、その強さでもあり弱さでもあります。これは普遍的にサポートされ、過去15年間に製造されたほぼすべてのデバイスでハードウェアアクセラレーションが施されており、成熟した、最適化されたエンコーダがあります。しかし、古くなりつつあります。4K、特に8Kコンテンツでは、H.264はストレージと帯域幅に負担をかけるビットレートを必要とします。
H.265(HEVC - 高効率ビデオコーディング)は、この問題に対処するために設計されました。H.264と同じ視覚品質で、約50%より良い圧縮を達成します。つまり、同じファイルサイズで著しく良い品質を提供します。あの10分間の4Kビデオは、H.265で200-300MBに圧縮できるかもしれません。問題点は、エンコーディングが大幅に遅くなる(H.264の2〜5倍長くなる)ことであり、特許ライセンスの問題が普及を制限しています。Appleデバイスでは良好にサポートされていますが、ウェブブラウザのサポートは不完全です。
Googleが開発したVP9は、H.265と類似の圧縮効率を提供しますが、ロイヤリティフリーです。YouTubeは4KコンテンツにVP9を広く使用しています。ChromeやFirefoxでは良好にサポートされていますが、古いデバイスではハードウェアアクセラレーションが限られています。エンコーディング時間はH.265と同様に遅くなりますが、ファイルサイズの節約は大きいです。
AV1は、H.265/VPよりもさらに30%の改善を約束する最新のコーデックです。
Written by the AI-MP4 Team
Our editorial team specializes in video production and multimedia. We research, test, and write in-depth guides to help you work smarter with the right tools.