
Kling Video O1로 AI 영상을 만드는 방법
APIMart에서 Kling Video O1을 사용해 AI 영상을 만드는 방법을 알아보세요. API 키 설정, 프롬프트 작성, 텍스트-투-비디오 및 레퍼런스 워크플로 실행, 내보내기까지 다룹니다.
2025년 12월 2일에 출시된 Kling Video O1은 18가지 영상 생성 및 편집 작업을 하나의 플랫폼으로 통합해 영상 제작을 간소화합니다. 텍스트 프롬프트로 영상을 만들고, 이미지를 애니메이션화하고, 기존 영상을 확장하고, 영상을 편집하는 작업을 모두 자연어 명령으로 수행할 수 있습니다. 개발자든, 기업이든, 콘텐츠 크리에이터든 Kling Video O1은 고품질 영상을 효율적으로 제작할 수 있는 도구를 제공합니다. 전문가급 대안으로는 일관된 영상 생성을 위한 MiniMax Hailuo 2.3도 살펴볼 수 있습니다.
시작하기 전에 알아두어야 할 내용은 다음과 같습니다.
- 핵심 기능: 텍스트-투-비디오, 이미지-투-비디오, 영상 편집, 레퍼런스 기반 영상 제작.
- 작동 방식: APIMart API를 통해 프롬프트나 레퍼런스 자료를 제출하면, 시스템이 최대 1080p 해상도의 영상을 생성합니다.
- 가격: 720p는 초당 $0.0672, 1080p는 초당 $0.0896부터 시작하며 APIMart를 통해 할인이 제공됩니다.
- 설정: APIMart 계정을 만들고, API 키를 생성한 뒤, API 엔드포인트를 연동하면 영상 제작을 시작할 수 있습니다.
Kling Video O1을 사용하면 단 몇 분 만에 완성도 높고 시각적으로 일관된 영상을 제작할 수 있습니다. 5초짜리 테스트 클립으로 작게 시작해 프롬프트를 다듬고, 전문가급 결과물을 위해 규모를 확장하세요.
새로운 AI 영상 생성기 Kling O1이 AI 영화 제작을 재정의합니다
Kling Video O1이 할 수 있는 것

Kling Video O1은 멀티모달 비주얼 언어(MVL) 프레임워크를 기반으로 작동하며, 텍스트, 이미지, 영상을 결합해 출력물 전반에 걸쳐 일관된 피사체 정체성, 스타일, 시네마틱 논리를 유지합니다.
핵심 기능 개요
Kling Video O1은 시네마틱 클립 생성, 이미지 애니메이션화, 샷 확장, 영상 편집까지 모두 영어 명령으로 처리하는 간소화된 워크플로를 제공합니다. 주요 기능을 간략히 정리하면 다음과 같습니다.
| 기능 모드 | 하는 일 | 최대 입력 |
|---|---|---|
| 텍스트-투-비디오 | 텍스트 프롬프트를 바탕으로 시네마틱 클립을 생성 | 텍스트만 |
| 이미지-투-비디오 | 시작 프레임과 선택적 종료 프레임 사이의 전환을 애니메이션화 | 이미지 2장 |
| 레퍼런스 비디오 | 기존 클립에서 장면을 확장하거나 모션 스타일을 전이 | 영상 1개 + 이미지 4장 |
| 영상 편집 | 텍스트 지시로 피사체, 의상, 배경을 변경 | 영상 1개 + 이미지 4장 |
| 레퍼런스 이미지-투-비디오 | 샷 전반에 걸쳐 안정적인 정체성으로 다중 캐릭터 장면을 애니메이션화 | 총 최대 7개 입력 |
이 시스템은 "Elements" 기능을 사용해 최대 4장의 이미지를 앵커로 삼아 역동적인 카메라 움직임 중에도 정체성 일관성을 유지합니다 [3].
"이 모델은 여러 샷과 역동적인 카메라 움직임 전반에 걸쳐 캐릭터, 오브젝트, 장면의 정체성을 놀라운 충실도로 유지할 수 있습니다." - Scenario Knowledge Base [3]
이러한 기능들이 결합되어 Kling Video O1은 고품질의 시각적으로 일관된 영상 콘텐츠를 생성하는 다재다능한 도구가 되며, 이는 MiniMax-Hailuo-02의 출력물과 유사합니다.
Kling Video O1이 돋보이는 이유
Kling Video O1을 차별화하는 것은 사고 기반 생성 프로세스입니다. 프레임을 렌더링하기 전에 모델은 구도, 모션, 조명, 장면 논리와 같은 요소를 두고 프롬프트를 평가합니다. 이 추론 단계가 프로세스에 60~180초를 추가하지만, 시각적 품질을 크게 향상시키고 지시 사항과의 정합성을 더 잘 보장합니다 [2].
영상 편집 기능은 특히 주목할 만합니다. 수동 마스킹이나 프레임 단위 편집이 필요한 전통적인 방식과 달리, Kling Video O1은 전체 클립의 모션 구조를 이해합니다. 예를 들어 "빨간 자동차를 파란 자동차로 바꿔줘"라고 말하기만 하면, 모델은 원래의 카메라 움직임과 장면 물리를 보존하면서 그 조정을 처리합니다 [4].
Professional 모드에서 최대 1080p 해상도, 5초 또는 10초 길이, 16:9, 9:16, 1:1 화면 비율을 지원하는 Kling Video O1은 소셜 미디어 콘텐츠부터 시네마틱 프리뷰까지 모든 용도에 이상적입니다 [1][2].
"kling-video-o1의 사고 기반 접근 방식이 확실히 드러납니다. Sora 2 같은 표준 모델과 비교했을 때 품질 차이가 바로 느껴집니다 - 프리미엄 콘텐츠를 위한 우리의 필수 선택지입니다." - Sarah Johnson, Creative Director [2]
Kling Video O1 워크플로 설정하기

시작을 위한 사전 준비 사항
Kling Video O1을 시작하려면 몇 가지 필수 요소가 필요합니다. APIMart 계정, 활성화된 API 키, 그리고 만들고자 하는 영상에 대한 명확한 아이디어입니다. 먼저 APIMart에서 계정을 등록하세요. 로그인한 뒤 API Key Management 섹션으로 이동해 API 키를 생성하세요. 이 키는 매우 중요합니다 - API로 보내는 모든 요청을 인증합니다. 다음과 같이 요청 헤더에 반드시 포함하세요.
Authorization: Bearer YOUR_API_KEY
코딩에 뛰어들기 전에 영상을 계획하는 데 시간을 들이세요. 피사체, 표현하고 싶은 동작, 전체적인 분위기, 그리고 공유할 플랫폼을 생각하세요. 이는 올바른 화면 비율을 선택하는 데 도움이 됩니다 - 가로 방향은 16:9, 세로 방향은 9:16, 정사각형은 1:1입니다.
콘셉트가 준비되면 APIMart를 통해 Kling Video O1을 연동해 고급 영상 생성 도구로 창의적인 비전을 실현하세요. 대안을 찾는다면 고일관성 영상 생성을 위한 WAN 2.6 API도 살펴볼 수 있습니다.
APIMart를 통해 Kling Video O1 연동하기

Kling Video O1은 단일 엔드포인트를 통해 접근할 수 있습니다.
https://api.apimart.ai/v1/videos/generations
이 엔드포인트로 요청을 보내면 task_id를 반환받습니다. 이 task_id를 사용해 "Get Task Status" 엔드포인트를 폴링하면 진행 상황을 모니터링하고 준비가 완료된 최종 영상 URL을 가져올 수 있습니다.
APIMart 가격은 Kling의 공식 요율 대비 20% 할인을 제공합니다. 예를 들면 다음과 같습니다.
- 720P (Standard 모드): 초당 $0.0672
- 1080P (Professional 모드): 초당 $0.0896
또한 이 서비스는 99.9% SLA 가동 시간 보장 하에 운영됩니다 [2].
"kling-video-o1의 고급 추론 기능은 생성 전에 프롬프트를 심층적으로 분석하여 최고 품질의 가장 일관성 있는 영상 출력을 만들어냅니다." - APIMart Service Highlights [2]
올바른 입력 유형 선택하기
이제 연동 설정이 끝났으니, 창의적인 요구에 가장 잘 맞는 입력 유형을 선택할 차례입니다. 아래 표는 각 옵션, 제공해야 할 항목, 그리고 이상적인 사용 사례를 정리한 것입니다.
| 입력 유형 | 제공할 항목 | 적합한 용도 |
|---|---|---|
| 텍스트-투-비디오 | 텍스트 프롬프트만 | 완전한 창작의 자유로 처음부터 장면 만들기 |
| 이미지-투-비디오 (단일) | 이미지 URL 1개 + 프롬프트 | 정체성을 유지하면서 캐릭터나 배경을 애니메이션화 |
| 이미지-투-비디오 (시작/종료) | 이미지 URL 2개 + 프롬프트 | 두 키프레임 사이를 부드럽게 전환 |
| 비디오-투-비디오 | 3~10초 영상 URL | 기존 영상 편집 또는 새로운 모션 스타일 적용 |
레퍼런스 이미지를 사용할 때는 정밀한 제어를 위해 <<<image_N>>> 형식으로 지정하세요(예: 첫 번째 이미지는 <<<image_1>>>). 영상 입력의 경우 다음 요건을 충족하는지 확인하세요.
- 포맷: MP4 또는 MOV
- 길이: 3~10초
- 파일 크기: 200MB 미만
Kling Video O1으로 영상 만들기
텍스트-투-비디오 워크플로
Kling Video O1을 시작하려면 먼저 명확하고 상세한 프롬프트를 작성하세요. 이것이 영상의 토대입니다. 프롬프트에는 피사체, 동작, 배경, 카메라 움직임, 조명 같은 구체적인 요소가 포함되어야 합니다. 예를 들면 다음과 같습니다. "홀로 있는 우주비행사가 붉은 화성 풍경을 천천히 가로질러 걷고, 그녀의 부츠 주변으로 먼지가 소용돌이치며, 와이드 트래킹 샷, 골든 아워 빛이 긴 그림자를 드리운다." 명확성과 정밀성을 유지하기 위해 프롬프트는 50~150단어 사이를 목표로 하세요.
"점차", "갑자기", "부드럽게" 같은 시간적 단서를 추가하면 장면의 페이싱을 정의하는 데 도움이 됩니다. 더 시네마틱한 느낌을 만들려면 전경, 중경, 배경의 요소를 묘사하세요. 이는 영상에 깊이와 자연스러운 시차(패럴랙스) 효과를 더합니다.
프롬프트가 준비되면 API 키, 프롬프트, 화면 비율, 해상도와 함께 POST 요청을 보내세요. 시스템이 태스크 ID로 응답합니다. 이 ID를 사용해 상태 엔드포인트를 폴링하고 영상 생성 진행 상황을 모니터링하세요. 이 과정은 보통 60~180초가 걸립니다. 동기화된 오디오와 함께 더욱 높은 품질의 결과물을 원한다면 Veo 3.1 API 사용도 고려할 수 있습니다. 최상의 결과를 위해서는 720P 해상도의 5초 테스트 렌더로 시작하세요. 이렇게 하면 완전한 10초 1080P 렌더에 착수하기 전에 프롬프트의 효과를 확인할 수 있어 시간과 비용을 모두 절약할 수 있습니다.
테스트를 마친 후에는 레퍼런스 기반 워크플로 같은 더 고급 방법으로 넘어가 영상을 한층 더 다듬을 수 있습니다.
레퍼런스 기반 영상 제작
최종 결과물에 대해 더 많은 제어가 필요하다면 레퍼런스 기반 생성이 정답입니다. 이 방법은 이미지, 캐릭터 시트, 기존 영상 같은 특정 시각 자산에 영상을 앵커링할 수 있게 해줍니다. 텍스트-투-비디오 워크플로를 기반으로 하며, 시각적 스타일과 일관성을 유지하는 데 더 높은 정밀도를 제공합니다.
이 방법을 사용하려면 미디어를 업로드하고 <<<image_1>>> 같은 지정 구문을 사용해 프롬프트에서 참조하세요. 캐릭터 일관성을 위해서는 정면, 반신, 클로즈업, 측면 샷 등 여러 레퍼런스 이미지를 업로드하여 Elements 시스템을 활용하세요. 이는 일관된 시각적 정체성 유지가 중요한 이커머스 제품 영상이나 브랜드 콘텐츠 같은 프로젝트에 특히 유용합니다.
"@Element 태깅 시스템이 다중 캐릭터 일관성을 다룰 수 있게 만드는 핵심입니다... 카메라 각도, 조명 변화, 장면 전환과 관계없이 그들의 시각적 정체성을 유지합니다." - Eachlabs
기존 영상을 다루는 프로젝트라면 비디오-투-비디오 모드를 시도하세요. 3~10초 MP4 또는 MOV 클립을 업로드하고 원하는 변경 사항을 설명하기만 하면 됩니다. 배경 교체, 모션 스타일 전이, 의상 변경 등 이 모드가 모두 처리합니다. 샷을 확장하려면 프롬프트를 다음과 같이 구성하세요. " <<<video>>> 를 바탕으로 다음 샷을 생성: [새로운 동작 설명]." 영상 레퍼런스 작업은 처리 복잡성이 추가되어 APIMart를 통해 720P는 초당 $0.1008, 1080P는 초당 $0.1344로 책정된다는 점을 유념하세요.
마지막으로, 항상 고품질의 조명이 잘 갖춰진 레퍼런스 이미지를 사용하세요. 모델이 최상의 결과를 내기 위해 입력의 품질에 의존하므로, 품질이 낮거나 흐릿한 자산은 깜빡임이나 불안정 같은 문제를 일으킬 수 있습니다.
영상 다듬기, 확장하기, 내보내기
후반 작업 편집하기
기본 클립이 준비되면 Kling Video O1은 후반 작업 편집을 손쉽게 만들어줍니다. 이러한 편집은 텍스트-투-비디오 또는 이미지-투-비디오 워크플로를 사용하든 초기 출력물을 향상시킵니다. Video to Video Edit 모드는 원래 모션을 보존하면서 배경 교체, 캐릭터 의상 변경, 조명 조정 같은 특정 요소를 손볼 수 있게 해줍니다. 이는 움직임은 완벽하지만 시각적 디테일에 미세 조정이 필요할 때 특히 유용합니다.
더 정밀한 조정을 위해서는 애니메이션화 전에 Image Editing 모드를 활용하세요. 최대 10장의 레퍼런스 이미지를 업로드해 캐릭터 의상 수정이나 장면 컬러 그레이딩 조정 같은 편집을 안내할 수 있습니다. 이 접근 방식은 더 깔끔한 시작점을 보장하고 여러 번 수정할 필요를 줄여줍니다.
흔한 아티팩트를 피하려면 요청에 네거티브 프롬프트를 추가해 보세요. 예를 들어 "blurry, morphed faces, low resolution, unnatural movement" 같은 용어를 포함해 출력물을 깔끔하게 유지하세요. 장면에 여러 캐릭터가 있다면 @Element 구문(예: @Element1)을 사용해 각 캐릭터의 정체성을 프레임 전반에 걸쳐 고정하여 원치 않는 시각적 불일치를 방지하세요.
"Kling O1은 그저 또 하나의 영상 생성기가 아닙니다 - 영상 편집을 일급 시민으로 취급하는 최초의 모델입니다." - Atlas Cloud
영상 길이 확장하기
클립을 다듬은 후에는 길이를 확장하여 내러티브를 넓힐 수 있습니다. Kling Video O1은 5초 또는 10초 클립을 생성하지만, Reference Video 모드로 샷을 연결하면 더 긴 시퀀스를 만들 수 있습니다. 3~10초 레퍼런스 클립(MP4 또는 MOV 포맷)을 업로드하고 @Video 태그를 사용해 프롬프트에서 이어질 내용을 설명하기만 하면 됩니다. 예를 들면 다음과 같습니다. "@Video를 바탕으로 다음 샷을 생성: 캐릭터가 문을 열고 햇빛이 드는 복도로 들어선다, 느린 돌리 전진." 이 방법은 원래 클립의 시네마틱한 느낌 - 카메라 움직임, 조명, 페이싱 - 을 유지하는 데 도움이 됩니다.
부드러운 전환을 만들려면 Reference Video 모드에서 샷을 연결하면서 시작 프레임과 종료 프레임을 설정하세요. 이 기법은 매끄러운 루프를 만들거나 두 장면을 잇는 데 안성맞춤입니다. 카메라 움직임(예: "트래킹 샷" 또는 "돌리 무브먼트")을 구체적으로 지정하여 새 구간이 원본 영상의 스타일과 맞아떨어지도록 하세요.
영상 내보내기 및 마무리하기
Kling Video O1은 24fps로 영상을 출력하며 해상도와 화면 비율을 커스터마이즈할 수 있습니다. 아래 표는 APIMart를 통해 제공되는 내보내기 옵션을 정리한 것입니다.
| 설정 | Standard | Professional |
|---|---|---|
| 해상도 | 720P | 1080P |
| 길이 | 5초 또는 10초 | 5초 또는 10초 |
| 화면 비율 | 16:9, 9:16, 1:1 | 16:9, 9:16, 1:1 |
| APIMart 가격 | 초당 $0.0672 | 초당 $0.0896 |
| 적합한 용도 | 프리뷰, 소셜 미디어 | 전문가용, 시네마틱 |
영상 편집과 확장이 끝나면 이 설정들이 배포를 위한 준비를 마쳐줍니다. 영상은 24시간 이내에 다운로드할 수 있습니다.
플랫폼별 전달을 위해서는 대상 청중에 맞춰 화면 비율을 맞추세요. TikTok, Instagram Reels, YouTube Shorts에는 9:16을, 시네마틱 또는 와이드스크린 포맷에는 16:9을 사용하세요. 잘 구성된 클립의 해상도를 높여야 한다면 Real-ESRGAN이나 Topaz Upscaler 같은 AI 업스케일러를 사용해 4K 품질을 달성하는 것을 고려하세요. 이 추가 단계는 대형 화면이나 방송용 콘텐츠에 특히 유용합니다.
"Kling Video O1의 사고 기반 접근 방식이 확실히 드러납니다. Kling은 추론에 뛰어나지만, WAN 2.7 같은 다른 모델들은 전문 영상 생성을 위한 세계 최고 수준의 일관성을 제공합니다. 표준 모델과 비교했을 때 품질 차이가 바로 느껴집니다 - 프리미엄 콘텐츠를 위한 우리의 필수 선택지입니다." - Sarah Johnson, Creative Director
결론: Kling Video O1으로 다음 단계 밟기
이제 워크플로가 어떻게 작동하는지 보고 주요 기능을 살펴보았으니, 첫 AI 기반 영상 제작에 뛰어들 준비가 되었습니다. Kling Video O1은 구조화된 텍스트 프롬프트와 레퍼런스 기반 편집으로 시작해, 원하는 플랫폼에 바로 사용할 수 있는 클립을 내보내기까지 전체 제작 과정을 안내합니다. 멀티모달 설계 덕분에 창의적인 아이디어를 순식간에 완성된 결과물로 전환하기가 더 쉬워집니다.
좋은 출발점은 짧은 5초 720P 클립을 실험해 보는 것입니다. 이렇게 하면 큰 프로젝트에 착수하지 않고도 프롬프트를 미세 조정할 수 있습니다. 설정을 확정하고 나면, 규모를 확장하는 것은 몇 가지 파라미터를 조정하는 것만큼이나 간단합니다. 대량 워크플로를 관리하는 팀에게 시간 절약은 판도를 바꾸는 요소가 될 수 있습니다 - Kling Video O1을 사용하는 일부 제작 팀은 프로젝트 일정을 3년에서 단 5개월로 단축했습니다 [5]. 게다가 APIMart의 종량제 가격은 강력한 가동 시간 보장에 힘입어 불필요한 비용 없이 안정적인 서비스를 제공합니다 [2].
그렇다면 다음은 무엇일까요? APIMart로 이동해 API 키를 생성하고 클립을 테스트해 프롬프트가 어떻게 작동하는지 확인하세요. 오늘 체험판을 시작하고 영상 제작 과정을 혁신하는 첫걸음을 내디디세요!
자주 묻는 질문(FAQ)
더 일관된 결과를 위한 최상의 프롬프트 구조는 무엇인가요?
Kling Video O1으로 안정적인 결과를 얻으려면 프롬프트를 신중하게 구성하는 것이 중요합니다. 간단한 공식은 다음과 같습니다. 피사체와 주요 동작으로 시작하고, 맥락(환경이나 카메라 움직임 등)을 이어서 넣고, 스타일이나 품질 디테일로 마무리하세요. 프롬프트는 간결하게, 이상적으로는 50~150단어 사이로 유지하는 것을 목표로 하세요.
레퍼런스 이미지를 다룰 때는 명시적인 라벨(예: @Element1)을 사용해 의도치 않게 섞이지 않도록 하세요. 더 복잡한 장면의 경우 공간 관계를 명확히 정의하고 프로젝트 전반에 걸쳐 일관된 용어를 유지하세요. 이 접근 방식은 특히 복잡한 구성에서 명확성과 정밀성을 유지하는 데 도움이 됩니다.
여러 샷에 걸쳐 동일한 캐릭터나 제품을 일관되게 유지하려면 어떻게 하나요?
Kling Video O1에서 일관된 캐릭터 또는 제품 외형을 유지하려면 Elements 기능을 활용하세요. 여러 각도에서 촬영한 고품질 레퍼런스 이미지를 최대 4장까지 업로드해 모델이 3D 이해를 형성하도록 도울 수 있습니다. 이 이미지들을 프롬프트에서 @Element 레퍼런스로 태그하여 정체성, 의상, 소품 같은 디테일을 확보하세요.
최상의 결과를 위해서는 명확하고 조명이 잘 갖춰진 정면 이미지를 사용하세요. 이를 구체적인 동작과 정밀한 카메라 지시를 포함한 요소 태그와 함께 사용하면 모든 것이 딱 맞게 보이도록 할 수 있습니다.
더 긴 영상을 생성하기 전에 총비용을 어떻게 추산할 수 있나요?
영상을 생성하는 데 비용이 얼마나 들지 계산하려면 원하는 해상도와 길이를 고려해야 합니다. Kling Video O1은 종량제 시스템으로 운영되며, 가격은 영상의 길이와 품질에 따라 달라집니다. 예를 들어 720p로 5초 클립을 만들면 $0.39, 1080p로 10초 클립을 만들면 $1.04가 듭니다. 선택하는 특정 출력 설정에 따라 최종 비용이 달라질 수 있다는 점을 유념하세요.
관련 블로그 게시물
모델 마켓에서 원하는 모델을 선택하세요
APIMart 모델 마켓에서 채팅, 이미지, 비디오 모델을 사용해 보고 하나의 통합 API로 모델 기능을 빠르게 경험하세요.