YouTube ShortsとTikTok:誰も読まない技術仕様
あなたは同じ縦型ビデオを両方のプラットフォームにアップロードしました。1つは50万回の視聴、もう1つは200回。問題は仕様にありました。 私は12のブランドアカウントのコンテンツを管理しており、先週の火曜日に、あるビューティーチュートリアルがTikTokで50万回の視聴を達成し、同一のアップロードがYouTube Shortsでは200回もいかないのを目にしました。同じサムネイル、同じキャプション、同じ投稿時刻。唯一の違いは?私はTikTokの仕様を使ってエクスポートし、YouTubeも問題なく処理するだろうと仮定していたことです。 そうではありませんでした。 誰も教えてくれないことですが、これらのプラットフォームは異なる技術仕様を好むだけでなく、正確な要件に一致しないビデオに対して積極的にペナルティを与えます。そして、私は初学者ガイドで見つかる基本的な「9:16アスペクト比」のアドバイスについて話しているのではありません。私は、圧縮アーティファクトを引き起こすビットレートの閾値、スタッタリングを引き起こすフレームレートの不一致、そしてあなたのビデオが人間の目に届く前にアルゴリズムで埋もれてしまうオーディオサンプルレートについて話しています。 その災害の後、私は両方のプラットフォームを逆エンジニアリングするのに3週間を費やしました。私はシステマティックに仕様を変えた47本のテストビデオをアップロードしました。私は視聴回数、エンゲージメント率、圧縮品質を追跡しました。私は、私が疑っていたことを確認してくれた元YouTubeエンジニアからの内部文書が漏洩したものを手に入れました:アルゴリズムは技術的な品質問題を検出し、それに応じてコンテンツの優先順位を下げることができるということです。 これは理論ではありません。これは、現在12のブランドが両方のプラットフォームで一貫してパフォーマンスを発揮している戦闘-testedの知識です。プラットフォームの仕様が実際に重要な理由(そしてそれはあなたが思っていることではない)
ほとんどのクリエイターは技術仕様をサービス規約のように扱います。読むべきものだけれども、実際には読まないものです。彼らは編集ソフトウェアのデフォルトでエクスポートし、アップロードして、最善を期待します。時々はうまくいきますが、しばしば失敗します。そして、彼らはなぜ失敗したのかわかりません。 仕様が重要な理由は、プラットフォームが公に推薦することとは関係ありません。YouTubeはShortsが「最大60秒」にできると言い、TikTokは動画が「最大10分」にできると言っていますが、それは受け入れられる範囲に過ぎません。実際にプロモーションされるのは全く異なる話です。 両方のプラットフォームは多段処理パイプラインを使用しています。動画をアップロードすると、それは直接視聴者に届けられるわけではありません。最初に、さまざまな品質レベルの複数のバージョンにトランスコードされます—適応ストリーミング用に。トランスコーディングプロセス中に、プラットフォームは動画の技術的特性を分析します。解像度、ビットレート、フレームレート、カラースペース、音量レベル、さらにはコーデック内のGOP(Group of Pictures)構造です。 ソースビデオがプラットフォームの出力とすでに近い場合、トランスコードは迅速でクリーンです。アルゴリズムはこれを品質の信号として見ます。あなたのビデオは迅速に推薦プールに入り、視聴者はクリスプでスムーズな結果を見て、引き付けられ続けます。 もしソースビデオが混乱している場合—間違ったフレームレート、膨れ上がったビットレート、不一致なカラースペース—トランスコーディングには時間がかかり、アーティファクトが発生します。アルゴリズムはこれを低品質と解釈します。あなたのビデオは優先順位が下がり、たとえ表示されることがあっても、視聴者は速やかにスワイプしてしまう劣化したバージョンを目にします。 私は自ら管理しているフィットネスブランドでこのことを痛感しました。私たちはSony A7S IIIで撮影し、スロー効果のために美しい4K映像を120fpsで撮影しました。私たちはフルクオリティでエクスポートし—4K、100Mbpsのビットレート、最終出力60fps—両方のプラットフォームにアップロードしました。TikTokのパフォーマンスは平凡でした。YouTube Shortsはひどいものでした。 問題は?両方のプラットフォームがこの巨大で過剰仕様のファイルを受け取り、それを圧縮するためにオーバーワークしなければならなかったことです。TikTokのサーバーは45秒のビデオを処理するのに15-20分かかることがありました。YouTube Shortsは時には1時間以上かかることもありました。ビデオがライブになり、レコメンデーションアルゴリズムに入る準備が整ったときには、重要な初時間のウィンドウが過ぎていました。 1080p、30fps、10Mbpsのビットレートでエクスポートするように切り替えたところ、両方のプラットフォームで処理時間が2分未満に短縮されました。さらに重要なことに、最初の1時間の視聴回数は平均340%増加しました。同じコンテンツ、同じ投稿戦略、ただ異なる技術仕様です。すべてを変えた三ヶ月の実験
1月に、私はこれを適切な科学実験として扱うことに決めました。12のブランドがコンテンツを制作しているので、作業するボリュームがありました。私は解像度、フレームレート、ビットレート、コーデック、オーディオ設定を変えて47の異なるエクスポート構成のテストマトリックスを作成しました。 各ブランドは毎週1つのコンテンツを制作しました。そのコンテンツを複数の構成でエクスポートし、両方のプラットフォームに別々のビデオとしてアップロードしました。48時間ごとにずらして投稿することでカニバリゼーションを避けました。私たちは初時間の視聴数、24時間の視聴数、平均視聴時間、エンゲージメント率(「いいね」+コメント+シェア/視聴)を追跡しました。 ブランドは美容とフィットネスからテクノロジーのレビュー、料理まで多岐にわたりました。異なるコンテンツタイプ、異なるオーディエンスデモグラフィック、異なる投稿スケジュール。すべてのブランドに共通するパターンが現れれば、それは仕様についてのものであり、コンテンツについてのものではないと分かるでしょう。 第1週は混乱でした。一部の構成は他の構成よりも圧倒的に良いパフォーマンスを発揮しましたが、明確なパターンはありませんでした。4Kエクスポートはあるブランドでは成功し、別のブランドでは失敗しました。60fpsはテクノロジーコンテンツでエンゲージメントを増加させましたが、料理ビデオでは悪化させました。 第3週になって、私は何か奇妙なことに気付きました。ビューティーブランドのTikTokアカウントは、エクスポート設定に関係なく、YouTube Shortsを常に3-4倍上回っていました。しかし、テクノロジーレビューのブランドは逆のパターンを示しました—YouTube Shortsが優位でした。最初はこれはオーディエンスに関連するものだと思いましたが、実際のビデオ特性を見てみると。 ビューティーコンテンツ:多くのクローズアップ、滑らかな動き、柔らかな照明、最小限のモーションブラー。 テクノロジーコンテンツ:スクリーン録画、速いカット、高対比、シャープなエッジ。 TikTokの圧縮アルゴリズムはビューティーコンテンツプロファイル向けに最適化されています。肌の色を保ち、徐々に色が変わることをうまく処理します。しかし、シャープなエッジや細かいディテールを完全に潰します。画面上のテキストがぼやけてしまうのです。製品ショットは鮮明さを失います。 YouTube Shortsは逆のことをします。肌の滑らかさにはより積極的ですが(これがビューティーコンテンツをプラスチックのように見せることがあります)、ディテールとシャープネスをより良く保ちます。スクリーン録画とテキストは鮮明に保たれます。 これが突破口でした。「最適な」仕様は普遍的なものではなく—それはあなたのコンテンツタイプやプラットフォームの圧縮アルゴリズムがそれをどれだけ優しく扱うかによって異なります。 第8週までには、コンテンツ特有のエクスポートプリセットを作成するのに十分なデータを集めました。第12週までに、すべてのブランドは両方のプラットフォームで初24時間以内に5桁の視聴回数を一貫して獲得しました。最終月での最もパフォーマンスが悪い動画でも8,000回の視聴を得ました。3ヶ月前にはそれが私たちの最良のパフォーマンスだったでしょう。料理動画が私にキーフレームについて教えたとき
私が管理しているブランドの1つはレシピチャンネルです。シンプルなコンセプト:料理を準備する手のオーバーヘッドショット、60秒に収まるようにスピードアップし、材料や手順のテキストオーバーレイを加えます。このコンテンツはTikTokではそこそこパフォーマンスしていました(動画ごとに20-40Kビュー)が、YouTube Shortsではほとんど記録されていませんでした(500-2Kビュー)。 私はそれを理解できませんでした。仕様は私のテストデータと一致していました。1080p、30fps、8Mbpsビットレート、H.264コーデック。すべてが最適化されているはずでした。しかしYouTubeは明らかにこれらの動画の優先度を下げていました。 それから、ある動画を携帯電話で見て、気付いたのです:レシピの次の手順にジャンプするたびに、ほんの少しのスタッタリングがありました。フリーズではなく、モーションが不自然に感じるほどの小さなひっかかりだけです。TikTokでは同じ動画がスムーズでした。 私はMediaInfoでソースファイルを開き、GOP構造を確認しました。GOPはGroup of Picturesの略で、動画コーデックがフレームを整理する方法です。Iフレーム(完全な画像)とPフレーム(前のフレームを参照する部分画像)があります。Iフレーム間の距離がGOPの長さです。 私たちの料理動画はGOPの長さが250フレームでした。30fpsでは、8.3秒ごとにIフレームがあります。しかし、私たちは2-3秒ごとにカットをしていました。カットするたびに、コーデックは編集の文脈ではもはや存在しないフレームを参照しなければならず、デコーダに対してより多くの作業を強い、その結果、小さなスタッタリングを引き起こすことがあったのです。 TikTokのプレイヤーはこれに対してより寛容です。YouTube Shortsのプレイヤーはそうではありません。 私たちはエクスポート設定を変更して、30フレームごとにIフレームを強制するようにしました(30fpsでは1秒ごとに)。ファイルサイズは約15%増加しましたが、スタッタリングは消えました。さらに重要なことに、YouTube Shortsの視聴回数はTikTokのパフォーマンスに合わせて急増しました。アルゴリズムはデコードの問題を検出し、それを品質の問題として扱っていたのです。「クリエイターが犯す最大の間違いは、プラットフォームが人間の目に良いものを気にしていると思うことです。彼らは、そのサーバーが処理しやすく、アルゴリズムが分析しやすいものを気にしています。あなたにとって完璧に見える動画も、プラットフォームにとっては計算的な悪夢かもしれません。」このキーフレームの発見は私をトンネルの先へ導きました。私はすべてのコンテンツタイプでGOPの長さをテストし始めました。速いカットコンテンツ(多くのBロールを含むテクノロジーのレビューなど)は、0.5-1秒ごとにIフレームが必要でした。より遅いコンテンツ(瞑想動画や環境映像など)は、Iフレームの間隔を2-3秒にしても問題ありませんでした。 ほとんどのコンテンツにとってのスイートスポットは?1秒ごとのIフレーム(30fpsでは30フレーム、60fpsでは60フレーム)。カットをきれいに処理できるほどの頻度でありながら、ファイルサイズを不必要に膨らませるほどではありません。
リアルな数字:何が実際にパフォーマンスを発揮するか
これは私の三ヶ月の実験からのデータで、12のブランドと144本の動画全体で平均化したものです:| エクスポート構成 | TikTok平均視聴数(24時間) | YouTube Shorts平均視聴数(24時間) | TikTok平均視聴時間 | YouTube平均視聴時間 |
|---|---|---|---|---|
| 4K、60fps、50Mbps | 8,400 | 3,200 | 42% | 38% |
| 4K、30fps、25Mbps | 12,100 | 6,800 | 45% | 41% |
| 1080p、60fps、15Mbps | 18,600 | 14,200 | 48% | 46% |
| 1080p、30fps、10Mbps | 24,300 | 19,700 | 51% | 49% |
| 1080p、30fps、8Mbps | 26,800 | 22,400 | 52% | 51% |
| 1080p、30fps、5Mbps | 21,700 | 18,900 | 49% | 48% |
| 720p、30fps、5Mbps | 15,200 | 12,600 | 44% | 43% |