Video Subtitles: Create SRT Files

March 2026 · 17 min read · 4,062 words · Last Updated: March 31, 2026Advanced

나는 화요일 밤 11시에 클라이언트에게 전화가 왔을 때 그녀의 긴장된 목소리를 아직도 기억한다. 그녀의 회사는 방금 그들의 주력 제품 데모를 YouTube에 업로드했다—그들이 제작하는 데 50,000달러를 쓴 비디오였다—그리고 두 시간 만에, 그들은 자막을 요청하는 47개의 댓글을 받았다. 오디오가 나쁘기 때문이 아니라, 소셜 미디어 비디오의 80%가 음소거 상태로 시청되기 때문이다. 그 단 하나의 실수로 인해, 그들은 첫 주에만 약 230만 번의 잠재적인 노출을 잃었다.

💡 주요 내용

  • SRT 파일이 당신이 생각하는 것보다 중요한 이유
  • SRT 파일 형식 이해하기
  • SRT 파일 생성 도구 및 소프트웨어
  • 내가 사용하는 단계별 프로세스

나는 마커스 첸이며, 지난 12년 동안 비디오 접근성 컨설턴트로 일하며 인디 유튜버부터 포춘 500대 기업까지 다양한 고객과 협력해왔다. 그동안 나는 34개 언어로 18,000개 이상의 SRT 파일을 생성하고 편집하며 품질을 점검했다. 영화 제작자 친구를 돕는 부업으로 시작한 일이 기술적 정밀성과 인간 커뮤니케이션의 교차점에 위치한 전문적인 실천으로 발전했다. 오늘은 SRT 파일 생성에 대해 내가 배운 모든 것을 안내할 것이다—관객 도달 범위를 좌우할 수 있는 영상 콘텐츠의 숨은 영웅들.

SRT 파일이 당신이 생각하는 것보다 중요한 이유

비디오 콘텐츠에 대한 나의 생각을 영원히 바꾼 몇 가지 숫자를 소개하겠다. Verizon Media와 Publicis의 연구에 따르면, 소비자의 69%가 공공 장소에서 소리를 끄고 비디오를 시청하며, 25%는 개인 설정에서도 소리를 끈 채로 시청한다. 이는 작은 청중이 아니라, 당신의 메시지를 완전히 놓치는 가능성이 있는 대다수의 시청자이다.

하지만 여기가 흥미로운 부분이다: 자막이 있는 비디오는 평균 40%의 증가된 시청 완료율을 보인다. 나는 나의 클라이언트 포트폴리오에서 이 수치를 추적했으며, 숫자는 놀랍도록 일관성이 있다. 내가 작년에 작업한 한 기술 스타트업은 튜토리얼 비디오의 완료율이 34%에서 58%로 증가했다. 이는 적절히 포맷된 SRT 자막을 추가함으로써 이루어진 것이다. 이는 첫 달에 12,000명의 추가 사용자들이 온보딩 프로세스를 완료하는 것으로 이어졌다.

SRT 파일—SubRip 자막 파일—은 그 이유로 업계 표준이다. 이들은 가볍고, 범용적으로 호환되며, 매우 유연하다. 비디오에 영구적으로 삽입된 자막과는 달리 SRT 파일은 활성화 및 비활성화할 수 있는 별도의 텍스트 파일로, 여러 언어로 번역할 수 있으며 원본 비디오를 수정하지 않고도 편집할 수 있다. 나는 회사들이 서로 다른 시장을 위해 비디오를 다시 렌더링 하는 대신 SRT 파일을 사용하여 수십 만 달러를 절약하는 것을 보았다.

접근성 각도 역시 매력적이다. 세계보건기구는 전 세계 4억 3천만 명이 청각 손실을 겪고 있다고 추정한다. 미국에서만 약 3750만 성인이 어느 정도의 청각 어려움을 가지고 있다. 자막을 제공하지 않으면 시청자를 잃는 것뿐만 아니라, 잠재 고객의 상당 부분을 적극적으로 제외하게 된다. 나는 충분한 비디오 접근성을 제공하지 못한 기업들이 법적 조치를 당한 세 건의 소송에 대해 자문을 맡았다. 각 사건은 법적 수수료를 제외하고 75,000달러에서 250,000달러 사이에 합의되었다.

SRT 파일 형식 이해하기

SRT 파일의 아름다움은 그 단순성에 있다. 수년에 걸쳐 WebVTT에서 TTML, 독점 형식에 이르기까지 수십 개의 자막 형식과 작업한 후, 나는 항상 그 우아한 직관성 때문에 SRT로 돌아오게 된다. SRT 파일은 .srt 확장자를 가진 일반 텍스트 파일로, 모든 비디오 플레이어가 해석할 수 있도록 특정한 방식으로 구조화되어 있다.

"자막이 있는 비디오와 없는 비디오의 차이는 단순한 접근성이 아니다—그것은 관객의 30%에 도달하는 것과 100%에 도달하는 것의 차이다."

SRT 파일 내의 각 자막 항목은 정확히 네 가지 요소를 포함한다: 순서 번호, 자막이 나타나고 사라지는 시점을 보여주는 타임스탬프, 자막 텍스트 자체, 그리고 다음 항목과 구분하는 빈 줄. 기본 항목의 모습은 다음과 같다:

1
00:00:01,000 --> 00:00:04,000
우리의 종합 비디오 제작 가이드에 오신 것을 환영합니다.

순서 번호(이 경우 1)는 각각의 자막을 세는 역할을 한다. 타임스탬프는 시:분:초,밀리초 형식을 사용한다. 그 화살표(-->)는 시작 시간과 종료 시간을 구분한다. 텍스트는 다음 줄에 나타나며, 다음 항목을 시작하기 전에 빈 줄을 남긴다.

나는 사람들이 이 형식을 과도하게 복잡하게 만드는 것을 보았지만, 내 경험상 간단히 유지하는 것이 최상의 결과를 얻는다. 타임스탬프 정밀도는 당신이 생각하는 것보다 더 중요하다. 나는 한 번 모든 타임스탬프를 가장 가까운 초로 반올림한 자막 파일의 디버깅을 해본 적이 있는데, 그 결과는 자막이 지속적으로 비동기적이라고 느껴졌다. 인간의 인지는 민감하다—우리는 200밀리초와 같은 작은 타이밍 불일치를 인식한다. 그래서 SRT는 밀리초 정밀도를 지원하며, 나는 항상 이를 사용한다.

초보자들이 자주 틀리는 중요한 세부 사항: SRT 파일은 UTF-8 인코딩으로 저장해야 한다. 자막이 이상하게 표시되거나 물음표로 나타나는 사례에서 최소 200건을 해결했으며, 90%의 경우 이는 인코딩 문제였다. UTF-8은 모든 플랫폼에서 특수 문자, 악센트 및 비라틴 스크립트가 올바르게 표시되도록 보장한다. 메모장에서 저장할 때 인코딩 드롭다운에서 UTF-8을 선택한다. 더 고급 편집기에서는 일반적으로 기본값이지만 항상 확인해야 한다.

SRT 파일 생성 도구 및 소프트웨어

수년에 걸쳐, 나는 약 60가지의 다양한 자막 생성 도구를 테스트해왔으며, 무료 오픈 소스 옵션부터 연간 5,000달러에 달하는 기업 솔루션까지 다양하다. 적절한 도구는 전적으로 작업 흐름, 예산 및 볼륨 요구 사항에 따라 달라진다. 내가 실제로 일상적인 작업에서 사용하는 도구에 기반하여 환경을 정리해보겠다.

자막 형식파일 크기플랫폼 지원최적의 사용 사례
SRT가장 작음 (5-20KB)범용 (YouTube, Vimeo, Facebook 등)일반 목적, 소셜 미디어, 스트리밍
VTT작음 (8-25KB)HTML5 비디오, 현대 웹 플레이어웹 기반 비디오 플레이어, 맞춤형 스타일링
ASS/SSA중간 (15-50KB)제한적 (VLC, 애니메이션 커뮤니티)고급 스타일링, 노래방 효과, 애니메이션
SCC크게 (50-200KB)방송 TV, 전문 비디오텔레비전 방송을 위한 폐쇄 자막

초보자나 가끔 사용하는 사람들에게, 나는 Subtitle Edit를 시작할 것을 추천한다—무료이면서도 강력한 Windows 응용 프로그램이다. 전혀 비용이 들지 않는데도 상당히 강력하다. 인터페이스는 비디오와 자막 타임라인을 나란히 보여주어 텍스트와 음성을 쉽게 동기화할 수 있다. 나는 Subtitle Edit에서 3,000개 이상의 SRT 파일을 생성했으며, 단 한 번도 프로그램이 중단된 적이 없다. 파형 시각화는 특히 유용하다—당신은 문자 그대로 말이 시작되고 멈추는 곳을 볼 수 있어 타이밍 조정이 매우 정밀해진다.

Mac 사용자들은 종종 대안에 대해 물어보며, 나는 그들에게 플랫폼 간에 작동하는 또 다른 무료 옵션인 Aegisub를 소개한다. Subtitle Edit보다 약간 더 복잡하지만 자막 스타일링 및 자동화 스크립트와 같은 고급 기능을 제공한다. 나는 주로 애니메이션 자막 작업을 했던 2년 동안 Aegisub만 사용했으며, 그곳에서 타이밍 정밀성은 절대적으로 중요하다. 오디오 스펙트럼 디스플레이는 내가 프레임 완벽한 타이밍을 달성하는 데 도와주었으며, 그렇지 않았다면 거의 불가능했을 것이다.

전문적인 작업 흐름에서는 시간이 곧 돈이므로 대부분의 고객 작업을 Descript 또는 Simon Says와 같은 도구로 이전했다. 이러한 AI 기반 플랫폼은 비디오를 자동으로 전사하고 SRT 파일을 생성한 후, 정확성을 위해 편집한다. 나는 최근 90분짜리 기업 교육 비디오를 Simon Says를 사용하여 처리했으며, 초기 전사에는 약 12분이 걸렸고 약 92%의 정확성을 보였다. 수동 수정에는 또 다른 45분이 필요했다. 처음부터 시작했을 때의 6-8시간과 비교하면, 15달러의 비용은 사소한 것이 된다.

AI 전사의 정확성은 지난 2년 동안 극적으로 개선되었다. 2021년에는 명확한 오디오에 대해 약 75-80%의 정확도를 보았다. 오늘날, 좋은 오디오 품질에서 90-95%의 정확도를 자주 목격한다. 하지만—이는 매우 중요하다—AI는 여전히 기술 용어, 고유 명사 및 악센트가 있는 음성을 처리하는 데 어려움을 겪는다. 나는 지난달 "심근 경색"을 세 번 "내 심장 감염"이라고 전사한 의료 교육 비디오에서 작업했다. 인간의 검토는 절대적으로 필수적이다.

내가 사용하는 단계별 프로세스

수천 개의 SRT 파일을 만든 후, 나는 속도와 품질을 균형 있게 조화시키는 체계적 작업 흐름으로 프로세스를 다듬었다. 이는 내가 워크숍에서 가르치는 정확한 방법이며, 고객이 자막 생성 시간을 평균 60% 단축하면서도 정확성을 향상시키는 데 도움을 주었다.

🛠 우리의 도구 탐색하기

MP4 vs MKV: 비디오 형식 비교 →
A

Written by the AI-MP4 Team

Our editorial team specializes in video production and multimedia. We research, test, and write in-depth guides to help you work smarter with the right tools.

Share This Article

Twitter LinkedIn Reddit HN

Related Tools

Compress Video Under 25MB — For Email & Discord, Free AI-MP4 vs HandBrake vs Kapwing — Video Tool Comparison Compress Video for Discord — Under 25MB Free

Related Articles

How to Add Subtitles to a Video for Free (3 Methods, Tested) Video Editing for Beginners: Free Tools and Tips - AI-MP4.com Video to GIF: How to Make Good GIFs (Not Blurry Messes)

Put this into practice

Try Our Free Tools →