[KiKa] Add extractor

2024-11-06 00:13:17 +00:00 · 2022-12-12 14:01:54 +01:00 · 2022-12-12 14:01:54 +01:00 · 164fbc7fc3
parent 351dc0bc33
commit 164fbc7fc3
2 changed files with 94 additions and 0 deletions
--- a/yt_dlp/extractor/_extractors.py
+++ b/yt_dlp/extractor/_extractors.py
@ -900,6 +900,7 @@
 )
 from .kicker import KickerIE
 from .kickstarter import KickStarterIE
+from .kika import KikaIE
 from .kinja import KinjaEmbedIE
 from .kinopoisk import KinoPoiskIE
 from .kommunetv import KommunetvIE
--- a/yt_dlp/extractor/kika.py
+++ b/yt_dlp/extractor/kika.py
@ -0,0 +1,93 @@
+# coding: utf-8
+from __future__ import unicode_literals
+
+from .common import InfoExtractor
+from ..utils import (
+    determine_ext,
+    int_or_none,
+    parse_duration,
+    parse_iso8601
+)
+
+
+class KikaIE(InfoExtractor):
+    IE_DESC = 'KiKA.de'
+    _VALID_URL = r'https?://(?:www\.)?kika\.de/(?:.*)/[a-z-]+-?(?P<id>\d+)(?:_.+?)?'
+
+    _GEO_COUNTRIES = ['DE']
+
+    _TESTS = [{
+        'url': 'https://www.kika.de/beutolomaeus-und-der-wahre-weihnachtsmann/videos/video59362',
+        'md5': 'b163ac8872f0cea1eb075cae3c275935',
+        'info_dict': {
+            'id': '59362',
+            'ext': 'mp4',
+            'title': '1. Der neue Weihnachtsmann',
+            'description': 'md5:61b1e6f32882e8ca2a0ddfd135d03c6b',
+            'duration': 787,
+            'uploader': 'KIKA',
+            'timestamp': 1669914628,
+            'upload_date': '20221201'
+        },
+    }]
+
+    def _real_extract(self, url):
+        video_id = self._match_id(url)
+
+        doc = self._download_json("https://www.kika.de/_next-api/proxy/v1/videos/video%s" % (video_id), video_id)
+        title = doc.get('title')
+        timestamp = parse_iso8601(doc.get('date'))
+        duration = parse_duration(doc.get('duration'))
+
+        video_url = doc.get('assets').get('url')
+        video_assets = self._download_json(video_url, video_id)
+        formats = self._extract_formats(video_assets, video_id)
+
+        subtitles = {}
+        ttml_resource = video_assets.get('videoSubtitle')
+        if ttml_resource:
+            subtitles['de'] = [{
+                'url': ttml_resource,
+                'ext': 'ttml',
+            }]
+        webvtt_resource = video_assets.get('webvttUrl')
+        if webvtt_resource:
+            vtt = {
+                'url': webvtt_resource,
+                'ext': 'webvtt'
+            }
+            subtitles['de'].append(vtt)
+
+        return {
+            'id': video_id,
+            'title': title,
+            'description': doc['description'],
+            'timestamp': timestamp,
+            'duration': duration,
+            'formats': formats,
+            'subtitles': subtitles,
+            'uploader': 'KIKA'
+        }
+
+    def _extract_formats(self, media_info, video_id):
+        streams = media_info.get('assets', [])
+        formats = []
+        for num, media in enumerate(streams):
+            stream_url = media.get("url")
+            ext = determine_ext(stream_url)
+            if ext == 'm3u8':
+                formats.extend(self._extract_m3u8_formats(
+                    stream_url, video_id, 'mp4', 'm3u8_native',
+                    m3u8_id='hls', fatal=False))
+            else:
+                f = {
+                    'url': stream_url,
+                    'format_id': 'a%s-%s' % (num, ext),
+                    'width': media.get('frameWidth'),
+                    'height': media.get('frameHeight'),
+                    'filesize': int_or_none(media.get('fileSize')),
+                    'abr': int_or_none(media.get('bitrateAudio')),
+                    'vbr': int_or_none(media.get('bitrateVideo')),
+                }
+                formats.append(f)
+        return formats