رمزگذاری/AV1 – FFMPEG ، Nvidia ادعا می کند رمزگذار AV1 بهتر از AMD و Intel است.
Nvidia ادعا می کند رمزگذار AV1 بهتر از AMD و اینتل است
. این منجر به کیفیت کلی بهتر می شود. .
AV1 یک کدک ویدیویی بدون منبع باز و Royalty است که توسط Alliance for Open Media (Aomedia) ، یک کنسرسیوم صنعت غیرانتفاعی ساخته شده است. بسته به مورد استفاده ، AV1 می تواند حدود 30 ٪ راندمان فشرده سازی بالاتر از VP9 و حدود 50 ٪ راندمان بالاتر از H به دست آورد.264.
در حال حاضر سه رمزگذار AV1 توسط FFMPEG پشتیبانی می شود: Libaom (با استفاده از Libaom-AV1 در FFMPEG) ، SVT-AV1 (libsvtav1) و Rav1e (Librav1e). این راهنما در حال حاضر روی Libaom و SVT-AV1 تمرکز دارد.
وابسته به لیبی
libaom (libaom-av1) رمزگذار مرجع برای فرمت AV1 است. . Libaom مبتنی بر Libvpx است و بنابراین بسیاری از ویژگی های آن را از نظر ویژگی ها ، عملکرد و استفاده به اشتراک می گذارد.
برای نصب FFMPEG با پشتیبانی از Libaom-AV1 ، به راهنماهای تلفیقی نگاه کنید و FFMPEG را با گزینه-Libaom کامپایل کنید.
Libaom حالت های کنترل نرخ زیر را ارائه می دهد که کیفیت و اندازه پرونده به دست آمده را تعیین می کند:
- کیفیت محدود
- 1 پاس متوسط بیترات
برای لیستی از گزینه ها ، ENCODER FFMPEG -H = LIBAOM -AV1 را اجرا کنید یا مستندات آنلاین FFMPEG را بررسی کنید. برای گزینه هایی که می توان از طریق -aom -params منتقل کرد ، بررسی خروجی -Help از برنامه Aomenc توصیه می شود ، زیرا در حال حاضر هیچ مرجع رسمی آنلاین برای آنها وجود ندارد.
توجه داشته باشید: کاربران Libaom قدیمی تر از نسخه 2.0.0 نیاز به اضافه کردن آزمایشگاه (یا نام مستعار -strict -2).
کیفیت ثابت
Libaom-AV1 دارای یک حالت کیفیت ثابت (CQ) (مانند CRF در x264 و x265) است که اطمینان حاصل می کند که هر قاب تعداد بیت هایی را که شایسته آن است برای دستیابی به یک سطح کیفیت خاص (ادراکی) بدست می آورد ، به جای رمزگذاری هر فریم برای دیدار با یک قاب هدف نرخ بیت. این منجر به کیفیت کلی بهتر می شود. اگر نیازی به دستیابی به اندازه پرونده هدف ثابت ندارید ، این باید روش انتخاب شما باشد.
برای تحریک این حالت ، به سادگی از سوئیچ -crf به همراه مقدار عددی مورد نظر استفاده کنید.
ورودی ffmpeg -i.MP4 -C: V libaom -av1 -crf 30 av1_test.MKV
مقدار CRF می تواند از 0-63 باشد. مقادیر پایین به معنای کیفیت بهتر و اندازه بیشتر پرونده است. 0 به معنای ضرر است. .
توجه داشته باشید که در نسخه های ffmpeg قبل از 4. . اگر این کار انجام نشده باشد ، سوئیچ -crf حالت کیفیت محدود را با بیت پیش فرض 256kbps ایجاد می کند.
کیفیت محدود
Libaom-AV1 همچنین دارای یک حالت کیفیت محدود (CQ) است که اطمینان حاصل می کند که کیفیت ثابت (ادراکی) در حالی که بیت را زیر یک محدوده فوقانی مشخص شده یا در یک محدوده خاص نگه می دارد ، به یک کیفیت ثابت (ادراکی) می رسد. این روش برای فیلم های رمزگذاری فله به روشی که به طور کلی سازگار است مفید است.
ورودی ffmpeg -i.MP4 -C: V Libaom -AV1 -CRF 30 -B: V 2000K خروجی.
باید غیر صفر باشد.
همچنین می توانید به جای یک هدف با کیفیت ، حداقل و حداکثر بیت را مشخص کنید:
ورودی ffmpeg -i.MP4 -C: V libaom -av1 -minrate 500k -b: v 2000k -maxrate 2500k خروجی.MP4
توجه داشته باشید: در صورت استفاده از MP4 ، ممکن است بخواهید اگر استفاده در نظر گرفته شده برای پرونده حاصل در حال پخش باشد ، -MovFlags +FastStart را به پارامترهای خروجی اضافه کنید.
. رمزگذاری دو پاس نیز برای رمزگذاری کارآیی در هنگام استفاده از کیفیت ثابت بدون بیت هدف مفید است. برای دو پاس ، شما باید دو بار FFMPEG را اجرا کنید ، تقریباً با همان تنظیمات ، به جز:
- .
- در عبور 1 ، خروجی به یک توصیف کننده پرونده تهی ، نه یک پرونده واقعی. (این یک logfile را ایجاد می کند که FFMPEG برای پاس دوم به آن نیاز دارد.
- در پاس 1 ، می توانید با مشخص کردن -an صدا را ترک کنید .
ورودی ffmpeg -i..MP4 -C: V Libaom -AV1 -B: V 2M -PASS 2 -C: خروجی Libopus.MKV
توجه داشته باشید: کاربران ویندوز باید به جای /dev /null و ^ به جای \ از nul استفاده کنند .
متوسط بیت (ABR)
Libaom-AV1 همچنین یک حالت ساده “متوسط بیت” یا “Bitrate Target” را ارائه می دهد. .جف. 2 مگابیت در ثانیه.
.MP4 -C: V Libaom -AV1 -B: V 2M خروجی.MKV
وت زمان رمزگذاری عوامل مهمتر از کیفیت به تنهایی است. در غیر این صورت ، از یکی از روشهای کنترل نرخ دیگر که در بالا توضیح داده شد استفاده کنید.
کنترل سرعت / کیفیت
-CPU با استفاده از فشرده سازی چقدر کارآمد خواهد بود. پیش فرض 1 است. مقادیر پایین به معنای رمزگذاری کندتر با کیفیت بهتر است و برعکس. مقادیر معتبر از 0 تا 8 فراگیر هستند.
-Row-MT 1 چند نخ مبتنی بر ردیف را فعال می کند که استفاده از CPU را به حداکثر می رساند. .اشمیه. -کاشی های 4×1 یا -tiles 2×2 برای 4 کاشی). فعال کردن ردیف-MT فقط در شرایطی که CPU دارای موضوعات بیشتری نسبت به تعداد کاشی های رمزگذاری شده باشد سریعتر است.
-استفاده از زمان واقعی حالت Realtime را فعال می کند ، منظور از موارد رمزگذاری زنده (پخش مستقیم ، پخش مستقیم ، ویدئو کنفرانس و غیره). -مقادیر استفاده شده از CPU بین 7-10 فقط در حالت Realtime موجود است (اگرچه به دلیل اشکال در FFMPEG ، از پیش تنظیم شده بالاتر از 8 از طریق FFMPEG قابل استفاده نیست).
قرار دادن صفحه کلید
به طور پیش فرض ، حداکثر فاصله keyframe Libaom 9999 فریم است. این می تواند منجر به جستجوی آهسته شود ، به خصوص با محتوایی که دارای تغییر صحنه های اندک یا نادر است.
از گزینه -g می توان برای تنظیم حداکثر فاصله keyframe استفاده کرد. هر چیزی تا 10 ثانیه برای بیشتر محتوا منطقی تلقی می شود ، بنابراین برای 30 فریم در هر محتوای ثانیه یک نفر از -g 300 استفاده می کند ، برای 60 فریم در ثانیه محتوای -G 600 و غیره.
برای تنظیم یک فاصله ثابت کلید ، هر دو -g و -keyint_min را روی همان مقدار تنظیم کنید. توجه داشته باشید که در حال حاضر -keyint_min نادیده گرفته می شود مگر اینکه همانند -G باشد ، بنابراین حداقل فاصله keyframe به خودی خود نمی تواند تنظیم شود.
برای خروجی فقط در داخل ، از -g 0 استفاده کنید .
HDR و عمق بیت بالا
. به عنوان مثال ، YouTube HDR از آن استفاده می کند
-ColorSpace BT2020NC -COLOR_TRC SMPTE2084 -COLOR_PRIMARIES BT2020
. بنابراین محتوا را می توان در 10 بیتی رمزگذاری کرد بدون اینکه نگران رمزگشاهای سخت افزاری ناسازگار باشد.
برای استفاده از 10 بیتی در نمایه اصلی ، از -pix_fmt yuv420p10le استفاده کنید . برای 10 بیتی با 4: 4: 4 زیر نمونه برداری Chroma (به مشخصات بالا نیاز دارد) ، از -pix_fmt yuv444p10le استفاده کنید . . برای قالب های پیکسل پشتیبانی شده ، ENCODER FFMPEG -HELP = LIBAOM -AV1 را ببینید.
رمزگذاری بدون ضرر
برای رمزگذاری بدون ضرر از -crf 0 استفاده کنید. به دلیل اشکال موجود در نسخه های FFMPEG قبل از 4.4 ، فریم اول بی ضرر حفظ نمی شود (مسئله در 21 مارس 2021 برطرف شد). به عنوان یک راه حل در پیش 4.4 نسخه ممکن است از -aom -params بدون ضرر = 1 برای خروجی بدون ضرر استفاده کند.
SVT-AV1 (libsvtav1) یک رمزگذار است که در ابتدا توسط اینتل با همکاری Netflix ساخته شده است. در سال 2020 ، SVT-AV1 توسط Aomedia به عنوان پایه ای برای توسعه آینده AV1 و همچنین تلاش های کدک آینده به تصویب رسید. رمزگذار از طیف گسترده ای از مبادلات و مقیاس های سرعت و مقیاس نسبتاً خوب در بسیاری از هسته های CPU پشتیبانی می کند.
برای فعال کردن پشتیبانی ، FFMPEG باید با-libsvtav1 ساخته شود . . همچنین به مستندات FFMPEG ، راهنمای کاربر Encoder Upstream و لیست کلیه پارامترها مراجعه کنید.
گزینه های زیادی با -SVTAV1 -params به رمزگذار منتقل می شوند . این در SVT-AV1 0 معرفی شد.9.1 و از FFMPEG 5 پشتیبانی شده است.1.
CRF روش کنترل نرخ پیش فرض است ، اما VBR و CBR نیز در دسترس هستند.
CRF
.
ورودی ffmpeg -i..
توجه داشته باشید که گزینه -crf فقط در ساخت FFMPEG GIT از 2022-02-24 پشتیبانی می شود. در نسخه های قبل از این ، مقدار CRF با -QP تنظیم شده است .
دامنه ارزش CRF معتبر 0-63 است که پیش فرض 50 است. مقادیر پایین تر با کیفیت بالاتر و اندازه بیشتر پرونده مطابقت دارند. رمزگذاری بدون ضرر در حال حاضر پشتیبانی نمی شود.
تجارت بین سرعت رمزگذاری و راندمان فشرده سازی با گزینه -preset اداره می شود. از SVT-AV1 0…
توجه داشته باشید که از پیش تعیین شده 13 فقط برای اشکال زدایی و اجرای رمزگذاری سریع محدب-هال در نظر گرفته شده است. در نسخه های قبل از 0.9.0 ، از پیش تنظیم های معتبر 0 تا 8 هستند.
به عنوان نمونه ، این دستور با استفاده از Pretet 8 و CRF 35 ضمن کپی کردن صدا ، یک ویدیو را رمزگذاری می کند:
ورودی ffmpeg -i.MP4 -C: کپی -c: v libsvtav1 -preset 8 -crf 35 svtav1_test.MP4
.9.1 ، رمزگذار همچنین از تنظیم کیفیت بصری (وضوح) پشتیبانی می کند. این با TUNE -SVTAV1 -PARAMS فراخوانی می شود = 0 . مقدار پیش فرض 1 است که رمزگذار PSNR را تنظیم می کند.
از 0 نیز پشتیبانی می شود.9.1 در حال تنظیم رمزگذار برای تولید بیت استریم هایی است که سریعتر (فشرده تر CPU) برای رمزگشایی هستند ، مشابه آهنگ FastDecode در x264 و x265. از SVT-AV1 1.0.0 ، این ویژگی با -SVTAV1-PARAMS FAST-DECODE = 1 فراخوانی می شود .
در 0.9.1 ، این گزینه یک عدد صحیح را از 1 تا 3 می پذیرد ، با تعداد بیشتری از آنها منجر به فیلم سازی آسان تر می شود. در 0.9.1 ، تنظیم رمزگشایی فقط برای از پیش تنظیم شده از 5 تا 10 پشتیبانی می شود ، و سطح تنظیم رمزگشایی بین پیش تنظیم شده متفاوت است.
قرار دادن صفحه کلید
به طور پیش فرض ، فاصله KeyFrame SVT-AV1 2-3 ثانیه است که برای اکثر موارد استفاده بسیار کوتاه است. در نظر بگیرید که این کار را تا 5 ثانیه (یا بالاتر) با گزینه -g (یا کلید در SVTAV1 -Params) تغییر دهید. -G 120 برای محتوای 24 فریم در ثانیه ، -G 150 برای 30 فریم در ثانیه و غیره.
توجه داشته باشید که از نسخه 1.2.1 ، SVT-AV1 از وارد کردن کلید های کلید در تغییرات صحنه پشتیبانی نمی کند. در عوض ، کلید های کلید در فواصل زمانی قرار می گیرند. در SVT-AV1 0.9.1 و قبل از.
SVT-AV1 از سنتز دانه فیلم پشتیبانی می کند ، یک ویژگی AV1 برای حفظ ظاهر ویدیوی دانه دار در حالی که برای انجام این کار بسیار کمی بیت را خرج می کند. .
. اعداد بالاتر با سطوح بالاتر دفع برای فرآیند سنتز دانه و در نتیجه مقدار بیشتری از دانه مطابقت دارند.
فرآیند Denoising دانه می تواند جزئیات را نیز از بین ببرد ، به خصوص در مقادیر بالایی که برای حفظ ظاهر فیلم های بسیار دانه دار مورد نیاز است. این را می توان با گزینه فیلم-دانه-denoise = 0 کاهش داد ، از طریق SVTAV1-PARAMS منتقل شد . .
رفیق
. کامپایل با-librav1e . گزینه های FFMPEG و گزینه های بالادست CLI را ببینید.
RAV1E ادعا می کند سریعترین نرم افزار رمزگذار AV1 است ، اما این واقعاً به تنظیم بستگی دارد.
AMD AMF AV1
چارچوب پیشرفته رسانه (AMF) دسترسی بهینه به GPU AMD را برای پردازش چندرسانه ای به توسعه دهندگان می دهد. رمزگذار AMD AMF AV1 یک رمزگذار ویدیویی حرفه ای است که قابلیت های رمزگذاری ویدیویی قدرتمند و طیف گسترده ای از گزینه های سفارشی سازی را فراهم می کند. این طراحی شده است تا نیازهای فردی کاربران مختلف را برآورده کند. کاربران می توانند تنظیمات پارامتر رمزگذار را برای پاسخگویی به نیازهای مختلف رمزگذاری مانند وضوح ، نرخ بیت ، نرخ فریم ، کیفیت رمزگذاری و موارد دیگر تنظیم کنند. این تنظیمات پارامتر می توانند بر اساس نیاز کاربران برای برآورده کردن سناریوهای رمزگذاری ویدیویی مختلف و نیازهای دستگاه سفارشی شوند.
استفاده
رمزگذار ویدیو عواملی مانند سرعت ، کیفیت و تأخیر را متعادل می کند. AMD چندین پیش تنظیم سناریوی کاربر معمولی را در رمزگذار AMF یکپارچه کرده است. . پارامتر استفاده از سناریوهای برنامه معمولی پشتیبانی می کند ، از جمله:
- کدگذاری: تبدیل فیلم های با وضوح بالا یا باکتری بالا به فیلم های با وضوح پایین یا کم دوتایی برای انتقال یا ذخیره سازی در محیط های شبکه محدود پهنای باند.
- کم نور: برای پخش ویدیو برنامه های زنده ، تأخیر کمتر و کیفیت فیلم بالاتر لازم است.
. این بهینه سازی ها و پیش تنظیمات پارامترها اکثریت پارامترها را شامل می شوند ، از جمله اما محدود به این موارد نیستند:
- رمزگذاری مشخصات و سطح
- اندازه و ساختار GOP
- حالت کنترل نرخ و استراتژی
- روش تخمین حرکت و دقت
- رمزگذاری چند گذر
- قدرت فیلتر دفع
- کمیت سازگار و بهینه سازی اعوجاج نرخ
- محدودیت های بیت و وضوح
با استفاده از این پیش تنظیمات ، کاربران می توانند به راحتی و کارآمد تنظیمات رمزگذاری مناسب را برای سناریوی استفاده خاص خود بدون نیاز به دانش عمیق از پارامترهای رمزگذار و تأثیر آنها بر کیفیت فیلم و عملکرد انتخاب کنند. سناریوی استفاده برای رمزگذاری
ffmpeg -s 1920x1080 -pix_fmt yuv420p -i ورودی.YUV -C: V H264_AMF -خروجی رمزگذاری استفاده.MP4
سناریوی استفاده برای پایین آمدن
ffmpeg -s 1920x1080 -pix_fmt yuv420p -i ورودی.YUV -C: V AV1_AMF -OUTEPUT.MP4
کیفیت
این پارامتر برای انتخاب بین کیفیت فیلم و سرعت استفاده می شود. این پارامتر تأثیر قابل توجهی در رمزگذاری سرعت دارد. این سه مقدار معتبر دارد:
- کیفیت: این از پیش تعیین شده برای خروجی ویدیویی با کیفیت بالا ، مناسب برای برنامه هایی مانند تولید فیلم ، پخش و پخش مستقیم.
- متعادل: این از پیش تعیین شده تجارت بین کیفیت و سرعت را متعادل می کند ، و آن را برای انواع برنامه های مختلف که نیاز به تعادل بین این دو دارند ، مانند کنفرانس ویدیویی و بازی های آنلاین ، مناسب می کند.
- سرعت: این از پیش تعیین شده سرعت بیش از کیفیت را در اولویت قرار می دهد ، و آن را برای برنامه هایی که نیاز به رمزگذاری ویدیویی در زمان واقعی با تأخیر کم دارند ، مانند بازی های آنلاین و برنامه های دسک تاپ از راه دور مناسب است.
ورودی ffmpeg -i.MP4 -C: V AV1_AMF -QUATIVE خروجی متعادل.ورودی mp4 ffmpeg -i.MP4 -C: V AV1_AMF -کیفیت کیفیت..MP4 -C: V AV1_AMF -QUATICE OUTPUT.MP4
اجرای_ هرت
رمزگشگر مرجع فرضی (HRD) به جلوگیری از سرریز بافر و زیر آب کمک می کند ، که می تواند باعث ایجاد مشکلاتی مانند لکنت یا انجماد در پخش ویدیو شود. HRD ممکن است سطح خاصی از کیفیت تصویر را فدا کند. پارامتر “Evorce_hrd” همیشه برای انواع سناریو لازم یا مناسب نیست. باید از آن به صورت انتخابی و با توجه دقیق به ویژگی های خاص محتوای ویدیویی که در آن رمزگذاری شده است استفاده شود.
.MP4 -C: V AV1_AMF -ENFORCE_HRD خروجی واقعی.MP4
VBAQ تکنیکی است که برای بهبود کیفیت بصری ویدیوی رمزگذاری شده استفاده می شود. این امر با تطبیق پارامترهای کمیت برای بلوک ها بر اساس پیچیدگی بصری محتوا ، به این امر دست می یابد. این امر به ویژه برای رمزگذاری ویدیو با محتوای بصری پیچیده ، مانند صحنه های با سرعت بالا یا با جزئیات بالا مؤثر است. ورودی ffmpeg -i.MP4 -C: V AV1_AMF -VBAQ خروجی واقعی.
مشخصات AV1 Bitstream شامل اطلاعات مربوط به برداشت برای رمزگشایی ها برای نمایش وضوح دقیق پیکسل نیست. انتظار می رود که به جای آن اطلاعات مناسب برای برداشت در ظرف ارائه شود. رمزگذار AMF AV1 پارامتر “تراز” را برای پرداختن به نیاز تراز سخت افزاری معرفی می کند به گونه ای که می توان بیت استریت رمزگذاری شده را رمزگشایی کرد و به درستی ارائه کرد. مقادیر تنظیم “تراز”:
- 64×16: فیلم های ورودی که وضوح آنها با 64×16 تراز شده است ، کدگذاری می شوند. فیلم های ورودی که وضوح آنها با 64×16 تراز نشده است ، کدگذاری نمی شوند. تمام فیلم های با وضوح دیگر پشتیبانی نمی شوند.
- 1080p: فیلم های ورودی که وضوح آن با 64×16 تراز شده است ، و همچنین فیلم 1920×1080 کدگذاری می شود. تمام فیلم های با وضوح دیگر پشتیبانی نمی شوند. . دو خط اضافی در انتهای قاب پر شده است ، پر از پیکسل های سیاه.
- هیچکدام: فیلم هایی با هر وضوح قابل رمزگذاری هستند. با این حال ، برای آن فیلم هایی که وضوح آن 64×16 تراز نشده است ، وضوح خروجی آنها به صورت 64×16 تراز شده و با پیکسل های سیاه تراز شده است. استثنا برای وضوح 1080p است ، که به 1082p اضافه می شود ، مانند مورد “1080p”.
ورودی ffmpeg -i.MP4 -C: V AV1_AMF -Align 1080p خروجی.MP4
قرار دادن صفحه کلید
به طور پیش فرض ، فاصله KeyFrame AMF AV1 250 فریم است که این یک مقدار متعادل برای اکثر موارد استفاده است. از گزینه “-g” می توان برای تنظیم فاصله keyframe استفاده کرد. . یک صفحه کلید 2 ثانیه ای به طور گسترده ای به عنوان یک تنظیم مشترک برای این منظور استفاده می شود. بنابراین ، برای محتوای با نرخ فریم 30 فریم در ثانیه ، یکی از دستور “-g 60” استفاده می کند.
ورودی ffmpeg -i.MP4 -C: V AV1_AMF -G 60 خروجی.MP4
منابع اضافی
- مستندات پارامترهای SVT-AV1
- راهنمای FFMPEG SVT-AV1
- SVT-AV1: سوالات مشترک و مباحث مورد علاقه
- ردیاب شماره SVT-AV1
- ردیاب شماره لیبوم
- ردیاب شماره RAV1E
Nvidia ادعا می کند رمزگذار AV1 بهتر از AMD و اینتل است
Nvidia می گوید رمزگذار AV1 آنها بهتر از AMD و اینتل است
دیروز نسخه پایدار Obs Studio 29.1 آزاد شد. درست مانند Betas ، این نسخه از رمزگذاری AV1 برای جریان YouTube پشتیبانی می کند. Nvidia از این فرصت استفاده کرد تا در مورد برتری خود در رمزگذاری AV1 در مقایسه با رقبا بحث کند.

AV1 یک کدک منبع باز از Alliance for Open Media است. در بیش از دو سال ، این کدک ویدیویی به عنوان یک جایگزین واقعی برای H264 و H265/HEVC ظاهر شده است که منبع باز نیستند. فرمت بدون حق امتیاز یک عامل بزرگ در ساخت AV1 آینده پخش ویدیو خواهد بود و همه مارک های اصلی GPU اکنون در هیئت مدیره قرار دارند و با پشتیبانی از این قالب ویدیویی به طور فعال در حال توسعه GPU هستند.
همانطور که می دانیم ، رمزگذاری AV1 اکنون توسط تمام معماری های مدرن GPUS پشتیبانی می شود: GeForce RTX 40 (ADA) ، Radeon RX 7000 (RDNA3) و ARC ALCHEMIST (XE-HPG). با این حال ، پیاده سازی ها متفاوت و قابلیت رمزگذاری ممکن است تفاوت های قابل توجهی را نشان دهد.
Nvenc که برای پشتیبانی از سخت گیری سازندگان محتوای حرفه ای طراحی شده است ، کیفیت فیلم را با دقت بالاتری نسبت به رمزگذارهای رقابتی حفظ می کند. .
– nvidia
NVIDIA یک مقایسه ویدیویی را منتشر کرده است که شامل AMD RX 7900 XTX ، ARC A770 و GPU های RTX 4080 آن در مقایسه رمزگذاری AV1 4K و 12 Mbps است. این شرکت ادعا می کند که رمزگذار آنها تصاویر با کیفیت بالاتری را با همان بیت تولید می کند:

مقایسه رمزگذاری AV1 4K ، منبع: nvidia
NVIDIA RTX 40 GPU به رمزگذار 8 ژنرال NVenc متکی است ، که با تقسیم قاب ها در خطوط افقی در برخی از GPU ها ، تا 8K60 (fps) را رمزگذاری می کند. در 4K ، می تواند کیفیت فیلم مشابهی را در 10 مگابیت در ثانیه در مقایسه با H ارائه دهد.264 جریان در 20 مگابیت در ثانیه ، اما به طور کلی NVIDIA ادعا می کند رمزگذاری AV1 حدود 40 ٪ راندمان رمزگذاری بهتر را فراهم می کند.
استودیوی Obs 29.1 اکنون برای بارگیری از وب سایت رسمی در دسترس است. این پروژه توسط NVIDIA و AMD حمایت مالی می شود.
کدک AV1 ، کدام کارتهای گرافیکی از آن پشتیبانی می کنند و چرا اهمیت دارد
صنعت فناوری اخیراً با پچ پچ در مورد رمزگذاری AV1 دچار مشکل شده است. ادعاهای جسورانه ای در مورد چگونگی انقلابی در پخش فیلم ، پخش بازی و اینترنت به طور کلی وجود دارد – اما AV1 چیست و چرا اینقدر مهم است?
مزایای کدک AV1
AV1 یک کدک ویدیویی جدید (نسبتاً) است که برای جریان های ویدیویی طراحی شده است. این مزایای قابل توجهی را نسبت به AVC ارائه می دهد (ساعت.264) و HEVC (ح.265) کدک ها در حال حاضر بیشتر مورد استفاده قرار می گیرند. برای مبتدیان ، AV1 برخلاف این گزینه های دیگر ، بدون حق امتیاز و منبع باز است ، زیرا از اتحاد برای رسانه های باز (Aomedia) ناشی می شود که در سال 2015 برای هدف صریح ایجاد یک جایگزین باز تشکیل شده است. Aomedia دارای هفت عضو بنیانگذار – Amazon ، Cisco ، Intel ، Microsoft ، Mozilla و Netflix – که در این راه به ده ها عضو دیگر مانند Google و Apple پیوسته اند.

برای موفقیت باید بیش از منبع آزاد و آزاد باشد. این دور از اولین تلاش در فضا است و در واقع بر روی شانه های سلف منبع باز ، VP9 و دیگران قبل از آن ساخته شده است. VP9 پذیرش معقول و منطقی از جمله پشتیبانی رمزگذاری سخت افزار در بسیاری از سیستم عامل ها به دست آورده است ، اما در نهایت به عنوان اغلب کارآمدتر از H در نظر گرفته می شود.265 با عملکرد مشابه. AV1 خیلی بهتر می شود.
بنابراین چگونه AV1 کار می کند?
AV1 از “تحول فرکانس مبتنی بر بلوک” برای رمزگذاری مانند بسیاری از قالب های دیگر استفاده می کند. در واقع ، این روش ها یک قاب را به “بلوک” های کوچک از گروه های پیکسل تقسیم می کنند ، سپس برخی از ریاضیات مربوط به تبدیل فوریه را برای ذخیره داده ها به گونه ای انجام می دهند که می تواند به طور قابل قبول بازسازی شود ، بدون اینکه داده های مورد نیاز برای توصیف هر بیت از هر پیکسل باشد. AV1 از راه حل VP9 به عنوان پایه استفاده می کند اما گزینه های خود را با تکنیک های اضافی گسترش می دهد.
در مورد AV1 ، از به اصطلاح Superblocks از 128×128 یا 64×64 پیکسل استفاده می کند که می تواند بیشتر به بلوک های کوچکتر به اندازه 4×4 پیکسل تقسیم شود. هنگامی که با روش های جدید بلوک های پارتیشن بندی ، مانند T Tapes ترکیب می شود ، فرآیند رمزگذاری بهتر می تواند لبه های اشیاء با مصنوعات بلوک کمتری را نشان دهد. این همه منجر به یک جریان ویدیویی می شود که برای یک هدف کیفیت تصویر خاص ، یا یک تصویر بهتر به نظر می رسد در همان Bitrate در مقایسه با سایر کدک ها ، نیاز به بیترات کمتری (و بنابراین پهنای باند) دارد.

سود بهره وری به این معنی است که AV1 قادر به پشتیبانی از ویژگی های بیشتر است. AV1 فیلم های HDR 4K را با گام های رنگی گسترده بسیار امکان پذیر می سازد. گرچه هنوز تقاضای زیادی برای آن وجود ندارد ، اما کدک حتی برای محتوای 8k مناسب است وقتی زمان آن فرا رسیده است. همچنین می توان از آن برای فیلم 360 درجه با تقاضای داده های مشابه استفاده کرد.
. رمزگذاری و رمزگشایی AV1 می تواند با مجبور کردن بی رحمانه آن بر روی CPU از طریق نرم افزار انجام شود ، اما از نظر محاسباتی فشرده تر از حتی H است.265 HEVC. این امر باعث می شود تا سخت افزار پایین تر از آن استفاده کند ، به این دلیل که تأثیر عمر باتری برای دستگاه های تلفن همراه را ذکر نمی کند.
با این حال ، اخیراً ، چندین سیستم عامل شروع به ترکیب رمزگذاری و رمزگشایی سخت افزار برای AV1 کرده اند. این مدارهای تخصصی به طور قابل توجهی کارآمدتر از آن هستند که نرم افزار بتواند از بین برود. مانند اکثر کدک ها ، رمزگشایی سخت افزار ابتدا به طور گسترده تری اجرا شده است. پشتیبانی فزاینده برای رمزگشایی به سیستم عامل های بزرگی مانند YouTube اجازه می دهد تا از کدک AV1 استفاده کنند تا خواسته های پهنای باند را کاهش دهد. ما فرض می کنیم که این امر به سیستم عامل های متمرکز Livestreaming مانند Twitch و همچنین یک بار رمزگذارهای اختصاصی در دست سازندگان محتوا بیشتر هستند.
رمزگشایی AV1 در سخت افزار در GPU های AMD RDNA 2 (خارج از NAVI 24 مبتنی بر 6500 XT) ، GPU های Nvidia GeForce 30- و 40 سری ، Intel XE و ARC GPU به همراه تراشه های تلفن همراه مانند سامسونگ Exynos 2100 و 2200 پشتیبانی می شود. انواع مختلف MediaTek Dimensal Soc و پردازنده Tensor Google. Qualcomm به ویژه در این لیست وجود ندارد اما نشان می دهد که کدک در تراشه های Snapdragon خود از سال 2023 پشتیبانی می شود. رمزگشایی پشتیبانی برای مصرف کنندگان محتوا بسیار عالی است ، اما بدون پشتیبانی از رمزگذاری سخت افزار ، محتوای AV1 بسیار کمرنگ است.

برای این منظور ، بازیکنان اصلی سیلیکون هم اکنون در حال حمایت از رمزگذاری AV1 برای پشتیبانی از ایجاد محتوا هستند. اینتل اولین کسی بود که واقعاً در فضای مصرف کننده مشتاق با پشتیبانی رمزگذاری سخت افزار AV1 در Arc Alchemist خود یک سری از کارتهای گرافیکی قرار گرفت. در حالی که منبع این کشور تا همین اواخر دشوار بوده است ، اما این شامل ستایش قابل توجهی شده است. به دنبال سوئیت ، با نام تجاری جدید RTX 40 سری Ada Lovelace GPU های NVIDIA نیز عضلات رمزگذاری AV1 را به همراه می آورند ، که ما مشتاقانه منتظر آزمایش خیلی زود هستیم. ما فقط می توانیم فرض کنیم GPU های RDNA3 به زودی اعلام شده AMD نیز از این مهمانی خارج نمی شوند.
آینده برای کدک AV1 روشن به نظر می رسد. علاوه بر رشد پشتیبانی سخت افزار برای کدک برای بهره مندی از جریان های ویدیویی ، کدک از یک روش کدگذاری لایه بندی به نام کدگذاری ویدیویی مقیاس پذیر (SVC) استفاده می کند ، که باعث می شود آن را به خصوص برای کنفرانس ویدیویی مناسب کند. یک مسئله مشترک ، به ویژه در تماس های کنفرانس پرجمعیت ، این است که کیفیت اتصال از یک کاربر به کاربر دیگر متفاوت است.
SVC به طور موثری اجازه می دهد تا رمزگذاری های بیت تررات پایین تر از منبع بیترات بالا در حالی که باعث کاهش افزونگی پخش جریان های موازی با کیفیت متفاوت می شود ، استخراج شود. . این تنها کدک نیست که از این تکنیک استفاده می کند ، اما با این وجود یک نکته بسیار مهم است.
. بهترین بخش این است که بیشتر مصرف کنندگان برای استفاده از آن نیازی به انجام کار خاصی ندارند. این به سازندگان محتوا و سیستم عامل های تحویل برای بهره گیری از این فناوری بستگی دارد ، در حالی که به زودی هر کسی که دارای یک دستگاه معقول و مدرن باشد قادر خواهد بود از مزایای بهبود کیفیت تصویر و استفاده از داده های پایین تر بهره ببرد.