Почему происходит потеря качества звука при оцифровке

Для получения приемлемого качества записи компьютерной музыки необходимо пользоваться аппаратурой, способной его обеспечить. К параметрам, от которых это зависит, относятся, в первую очередь:

  • Разрядность аналого-цифрового и цифроаналогового преобразователей звуковой карты;
  • Диапазон частот дискретизации.

Разрядность звуковой карты существенно влияет на качество звука. Однако перед тем как перейти к более детальному обсуждению этого вопроса, следует пояснить, что речь идет о разрядности аналого-цифрового преобразователя (АЦП) (Analog/Digital Converter — ADC) и цифроаналогового преобразователя (ЦАП) (Digital/Analog Converter — DAC).

Звуковые карты двойного назначения имеют в своем составе одновременно два функционально независимых узла: синтезатор и устройство оцифровки звуковых сигналов, поступающих с внешнего источника. В каждый из узлов входит как минимум по одному ЦАП. В устройстве оцифровки, кроме того, имеется АЦП. Некоторые полупрофессиональные звуковые карты оборудованы 24-битными ЦАП/АЦП. Звуковые редакторы, работая с любыми звуковыми картами, в том числе и 16-битными, в процессе преобразований отсчетов сигнала используют арифметику с разрядностью двоичного представления числа, превышающей 16. Это позволяет уменьшить погрешность, накапливающуюся в процессе выполнения сложных алгоритмов обработки, которая в противном случае проявлялась бы как искажение звука.

Почему же столь важно наличие большого числа разрядов в устройствах ЦАП и АЦП? Дело заключается в том, что непрерывный (аналоговый) сигнал преобразуется в цифровой с некоторой погрешностью. Эта погрешность тем больше, чем меньше уровней квантования сигнала, т. е. чем дальше отстоят друг от друга допустимые значения квантованного сигнала. Число уровней квантования в свою очередь зависит от разрядности АЦП/ЦАП. Погрешности, возникающие в результате замены аналогового сигнала рядом квантованных по уровню отсчетов, можно рассматривать как его искажения, вызванные воздействием помехи. Эту помеху принято образно называть шумом квантования.

Шум квантования представляет собой разность соответствующих значений реального и квантованного по уровню сигналов.

В случае превышения сигналом значения самого верхнего уровня квантования ("старшего" кванта), а также в случае, когда значение сигнала оказывается меньше нижнего уровня квантования ("младшего" кванта), т. е. при цифровом ограничении сигнала, возникают искажения, более заметные по сравнению с шумом квантования. Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу: значения сигнала должны располагаться между уровнями, соответствующими младшему и старшему квантам. При записи внешних источников звука это достигается с помощью регулировки их уровня, кроме того, применяется сжатие (компрессия) динамического диапазона, о которой речь пойдет в разд. 1.10.2.

В звуковых редакторах существует операция нормализации амплитуды сигнала. После ее применения наименьшее значение сигнала станет равным верхнему уровню младшего кванта, а наибольшее — нижнему уровню старшего кванта. Таким образом, от ограничения сигнал сверху и снизу будет защищен промежутками, шириной в один квант.

Для нормированного сигнала относительная величина максимальной погрешности квантования равна 1/N, где N — число уровней квантования. Этой же величиной, представленной в логарифмических единицах (децибелах), оценивается уровень шумов квантования АЦП звуковой карты. Уровень шумов квантования определяется по формуле: D = 201g (1/N). Для восьмиразрядного АЦП N = 256, D = -48 дБ; для шестнадцатиразрядного — N = 65536,; D= -96 дБ и для двадцатиразрядного АЦП N = 1648576, D = -120 дБ. Эти цифры наглядно демонстрируют, что с ростом разрядности АЦП шум квантования уменьшается. Приемлемым считается шестнадцатиразрядное представление сигнала, являющееся в настоящее время стандартным для воспроизведения звука, записанного в цифровой форме. С точки зрения снижения уровня шумов квантования дальнейшее увеличение разрядности АЦП особого смысла не имеет, т. к. уровень шумов, возникших по другим причинам (тепловые шумы, а также импульсные помехи, генерируемые элементами схемы компьютера и распространяющиеся либо по цепям питания, либо в виде электромагнитных волн), все равно оказывается значительно выше, чем -96 дБ.

Однако увеличение разрядности АЦП обусловлено еще одним условием — стремлением расширить его динамический диапазон. Динамический диапазон некоторого устройства обработки может быть определен выражением D = 201g (Smax/Smin), где Smax и Smin — максимальное и минимальное значения сигнала, который может быть преобразован в цифровую форму без искажения и потери информации. Вы уже, наверное, догадались, что минимальное значение сигнала не может быть меньше, чем напряжение, соответствующее одному кванту, а максимальное — не должно превышать величины напряжения, соответствующего N квантам. Поэтому выражение для динамического диапазона АЦП звуковой карты примет вид: D = 201g (N). Ведь можно считать, что Smax= kN, a Smin = k1, где k — некоторый постоянный коэффициент пропорциональности, учитывающий соответствие электрических величин (тока или напряжения) номерам уровней квантования.

Из сравнения выражений для А и D становится ясно, что при одинаковой разрядности АЦП эти величины будут отличаться лишь знаками. Поэтому динамический диапазон для шестнадцатиразрядного АЦП составляет 96 дБ, для двадцатиразрядного — 120 дБ. Иными словами, для записи звучания некоторого источника звука, динамический диапазон которого равен 120 дБ, требуется двадцатиразрядный АЦП. Если такого нет, а имеется только шестнадцатиразрядный, то динамический диапазон звука должен быть сжат на 24 дБ: со 120 дБ до 96 дБ.

В принципе, существуют методы и устройства сжатия (компрессии) динамического диапазона звука, и мы еще будем говорить о них (см. разд. 1.10.2). Но то, что они проделывают со звуком, как ни смягчай формулировки, все равно, представляет собой его искажение. Именно поэтому так важно для оцифровки звука использовать АЦП, имеющий максимальное количество разрядов. Динамические диапазоны большинства источников звука вполне соответствуют динамическому диапазону 16-битной звуковой карты. Кроме того, 24-битное или 32-битное представление сигнала применяется в основном на этапе обработки звука. Конечная аудиопродукция (CD Digital Audio и DAT) реализуется в 16-битном формате.

После того как мы немного разобрались с разрядностью АЦП звуковой карты, пришло время поговорить о частоте дискретизации.

В процессе работы АЦП происходит не только квантование сигнала по уровню, но и его дискретизация во времени. Сигнал, непрерывно изменяющийся во времени, заменяют рядом отсчетов этого сигнала. Обычно отсчеты сигнала берутся через одинаковые промежутки времени. Интуитивно ясно, что если отсчеты отстоят друг от друга на слишком большие интервалы, то при дискретизации может произойти потеря информации: важные изменения сигнала могут быть "пропущены" преобразователем, если они произойдут не в те моменты, когда были взяты отсчеты. Получается, что отсчеты следует брать с максимальной частотой. Естественным пределом служит быстродействие преобразователя. Кроме того, чем больше отсчетов приходится на единицу времени, тем больший размер памяти необходим для хранения информации.

Проблема отыскания разумного компромисса между частотой взятия отсчетов сигнала и расходованием ресурсов трактов преобразования и передачи информации возникла задолго до того, как на свет появились первые звуковые карты. В результате исследований было сформулировано правило, которое принято называть теоремой Найквиста — Котельникова.

Если поставить перед собой задачу обойтись без формул и использования серьезных научных терминов типа "система ортогональных функций", то суть теоремы Найквиста — Котельникова можно объяснить следующим образом. Сигнал, представленный последовательностью дискретных отсчетов, можно вновь преобразовать в исходный (непрерывный) вид без потери информации только в том случае, если интервал межу соседними отсчетами не превышает половины периода самого высокочастотного колебания, содержащегося в спектре сигнала.

Читайте также:  Аппарат дарсонваль для чего нужен

Из сказанного следует, что восстановить без искажений можно только сигнал, спектр которого ограничен некоторой частотой Fmax. Теоретически все реальные сигналы имеют бесконечные спектры. Спектры реальных сигналов, хотя и не бесконечны, но могут быть весьма широкими. Для того чтобы при дискретизации избежать искажений, вызванных этим обстоятельством, сигнал вначале пропускают через фильтр, подавляющий в нем все частоты, которые превышают заданное значение Fmax, и лишь затем производят дискретизацию. Согласно теореме Найквиста — Котельникова частота дискретизации, с которой следует брать отсчеты, составляет Fд = 2Fmax. Теорема получена для идеализированных условий. Если учесть реальные свойства сигналов и устройств преобразования, то частоту дискретизации следует выбирать с некоторым запасом по сравнению со значением, полученным из предыдущего выражения.

В стандарте CD Digital Audio частота дискретизации равна 44,1 кГц. Для цифровых звуковых магнитофонов (DAT) стандартная частота дискретизации составляет 48 кГц. Звуковые карты, как правило, способны работать в широком диапазоне частот дискретизации.

В последнее время становится все более популярным стандарт DVD-audio, где частота дискретизации может быть равной 44,1/48/88.2/96 кГц, разрешающая способность 16/20/24 бит, количество каналов — до 6.

Для воспроизведения звукового сигнала, записанного в цифровой форме, необходимо преобразовать его в аналоговый сигнал.

Цифроаналоговое преобразование в общем случае происходит в два этапа. На первом этапе из потока цифровых данных с помощью цифро-аналогового преобразователя выделяют отсчеты сигнала, следующие с частотой дискретизации. На втором этапе путем сглаживания (интерполяции) из дискретных отсчетов формируется непрерывный во времени аналоговый сигнал.

На выходе простейшего ЦАП сигнал представляет собой последовательность узких импульсов, имеющих многочисленные высокочастотные спектральные компоненты. На аналоговый фильтр в этом случае возлагается задача полностью пропустить сигнал нужного частотного диапазона (например, 20 Гц — 20 кГц) и по возможности наиболее полно подавить ненужные высокочастотные компоненты. К сожалению, аналоговому фильтру выполнить такие противоречивые требования не под силу. Поэтому цифровой сигнал сначала интерполируют, то есть вставляют дополнительные отсчеты, вычисленные по специальным алгоритмам, и тем самым резко увеличивают частоту дискретизации. При этом исходный спектр полезного сигнала не искажается, а сигнал оказывается дискретизированным на значительно более высокой частоте. Это приводит к тому, что побочные спектральные компоненты на выходе ЦАП далеко отстоят от частотных компонентов основного сигнала и, чтобы отфильтровать их, достаточно простого аналогового фильтра.

После первого этапа цифроаналогового преобразования информация о величине звукового сигнала имеется только в определенные моменты, соответствующие частоте дискретизации АЦП. Дополнительная информация о форме сигнала между отсчетами отсутствует. Задачей второго этапа цифро-аналогового преобразования является восстановление значения сигнала между отсчетами, или интерполяция.

Наибольшее распространение получили линейные методы интерполяции формы сигнала по его дискретным отсчетам, основанные на использовании цифровых фильтров. В исходную последовательность отсчетов сигнала вставляются дополнительные нулевые отсчеты. Новая полученная последовательность подается на интерполирующий цифровой фильтр, в котором нулевые отсчеты преобразуются в очень точно реконструированные отсчеты исходного сигнала. Затем для сглаживания и окончательного восстановления сигнал подается на простой аналоговый фильтр. Полученный в результате цифроаналогового преобразования звуковой сигнал, как правило, попадает в микшер звуковой карты.

0 некоторых проблемах, связанных с ЦАП/АЦП

Обычно шум квантования представляют как разность соответствующих значений реального и квантованного по уровню сигналов (рис. 1.8, а, б).

Такое представление не совсем верно.

На рис. 1.8, а на самом деле цифровой сигнал не показан. Ступенчатая линия — это отображение аналогового сигнала, восстановленного из цифрового с использованием интерполяции нулевого порядка. Если из исходного аналогового сигнала вычесть эту ступенчатую линию, то получится очень странная и некрасивая линия (рис. 1.8, б). Некоторые авторы пишут, что это и есть шум квантования. Но, во-первых, кто сказал, что нужно заменять цифровой сигнал непрерывными ступеньками, и почему именно ступеньками, а не наклонными отрезками прямых линий или кривыми? Во-вторых, в действительности мы имеем право сравнивать непрерывные и дискретные сигналы только в моменты, соответствующие дискретным отсчетам. Поэтому и шум квантования следует представлять последовательностью дискретных отсчетов (рис. 1.8, в).

Рис. 1.8. Иллюстрация процесса квантования сигнала (интерполяция нулевого порядка):

В теоретических работах для представления дискретных сигналов используют функцию отсчетов (дельта-функцию) — бесконечно большой по амплитуде и бесконечно короткий по времени импульс. Площадь дельта-функции равна единице. Разумеется, функции отсчетов в природе не существуют. На практике они заменяются прямоугольными импульсами малой длительности.

Если взять последовательность смещенных во времени функций отсчетов и умножить ее на ординаты кривой линии, соответствующей аналоговому сигналу, то получится дискретный по времени сигнал, который можно представить графически так, как показано на рис. 1.8, в. В данном случае это и есть шум квантования, представленный дискретными отсчетами.

Не существует и идеальных фильтров, с помощью которых можно было бы точь-в-точь восстановить аналоговый сигнал по его дискретным значениям. Однако в современных АЦП используются методы, позволяющие свести погрешности, обусловленные неидеальностью преобразования, к разумному минимуму.

На рис. 1.9, а показан исходный аналоговый сигнал и сигнал, восстановленный из цифрового с использованием интерполяции 1-го порядка (отсчеты соединяются отрезками прямых линий).

Видно, что разница между исходным и восстановленным сигналом (рис. 1.9, б) гораздо меньше, чем при использовании интерполяции нулевого порядка (рис. 1.8, а). А ведь в современных ЦАП используются гораздо более сложные алгоритмы восстановления аналогового сигнала.

Что касается цифрового шума квантования (рис. 1.8, в), бесспорно, при цифроаналоговом преобразовании он трансформируется в некий аналоговый шум. Вид этого шумового колебания будет зависеть от конкретного АЦП, но его уровень будет гораздо меньше, чем уровень шумового процесса, показанного на рис. 1.8, б.

Распространенная среди сторонников аналогового звука страшилка "Результат дискретизации ужасно отличается от исходного сигнала" основана именно на неадекватном представлении шума квантования (рис. 1.8, б).

Рис. 1.10. Квантование сигнала по уровню и искажения при клиппировании сигнала:

Из рис. 1.10 видно, что в случае превышения сигналом значения самого верхнего уровня квантования ("старшего" кванта), а также в случае, когда значение сигнала оказывается меньше нижнего уровня квантования ("младшего" кванта), т. е. при ограничении сигнала, возникают искажения. Они могут быть гораздо более заметными по сравнению с шумом квантования.

Для исключения искажений этого типа динамические диапазоны сигнала и АЦП должны соответствовать друг другу.

Следует упомянуть еще об одном заблуждении. Иногда им грешат даже профессиональные звукорежиссеры. Они утверждают примерно следующее: "Поведение восстановленного сигнала в промежутках между отсчетами не определено, он может изменяться произвольным образом". Однако, говоря так, они забывают о том, что спектр аналогового сигнала, подвергающегося цифроаналоговому преобразованию, обязательно должен быть ограничен. Поэтому при аналого-цифровом преобразовании его значения между дискретными отсчетами не могут быть произвольными и поддаются однозначному восстановлению по этим отсчетам.

Читайте также:  Создание форума на wordpress

Довольно часто изготовители, доказывая преимущество своих звуковых карт, подчеркивают такое обстоятельство, как наличие у звуковой карты цифрового входа и/или выхода. Действительно, если звуковая карта имеет выход, на который сигналы поступают не в аналоговой (после ЦАП), а в цифровой форме, это позволяет уменьшить искажения, связанные с дополнительными преобразованиями при дальнейшей цифровой обработке сигнала вне звуковой карты.

В соответствии с концепцией виртуальной студии звукозаписи вся обработка должна выполняться средствами одного PC. С помощью этого же PC можно получить и конечный продукт — компакт-диск. ЦАП высокого качества нужен только лишь для мониторинга, т. е. для того, чтобы слышать происходящее в виртуальной студии. Наличие цифрового выхода в виртуальной студии дает преимущества только тогда, когда требуется выполнить запись на DAT или подключить высококачественные акустические мониторы, снабженные цифровым входом.

Наличие цифрового входа в виртуальной студии может быть актуальным в том случае, если вас не устраивает качество работы встроенного в звуковую карту АЦП и вы хотите использовать более качественный внешний АЦП. Кроме этого, цифровой вход может быть полезен, если требуется "перегнать" запись с DAT в PC.

Шум квантования. Как с ним бороться? Если для представления звука использовать 24- или 32-битные отсчеты, то о шуме квантования можно забыть (так он слаб). Да вот беда — основным потребительским аудиоформатом является формат компакт-дисков: 16 бит/44,1 кГц/стерео. Поэтому разрядность представления звуковых данных приходится понижать. Даже при 16-битном разрешении звука шум квантования неуловимо мал, тем не менее, он обладает одной пренеприятнейшей особенностью: этот шум коррелирован с полезным сигналом. Именно шум квантования принимает самое активное участие в формировании негативного образа цифрового звука в умах людей — он плоский, металлический, пластмассовый и т. п. Как только раньше ни называли 16-битный звук! Так было до появления специальных методов обработки цифрового звука, называемых дитерингом (dithering) и нойзшейшнгом (noise shaping). Суть дитеринга состоит в том, что до понижения разрядности к полезному сигналу подмешивается очень слабый специфичный шум. В результате шум квантования попросту забивается этим шумом, который в силу своих статистических свойств гораздо меньше действует на психику человека. Конечно, в результате получается более шумная запись, но шум этот, как и шум квантования, практически неуловим на слух.

Еще один метод борьбы с шумом квантования, нойзшейпинг, заключается в применении специальных алгоритмов округления значений звуковых отсчетов при понижении разрядности. После применения нойзшейпинга большая часть энергии шума квантования сосредоточена в области высоких частот, к которым человеческий слуховой аппарат наименее восприимчив. Обычно нойзшейпинг применяется совместно с дитерингом..

Есть еще комплекс проблем: транкейт (от truncate — усечь) — то, что раньше мы называли понижением разрядности цифрового звука. Был сигнал 24-битным, стал 16-битным — произошел транкейт. С одной стороны, понижение разрядности цифрового звука дело обычное. Стоило ли вводить специальный термин? Однако термином truncate обозначают целый комплекс проблем, возникающих при работе с цифровым звуком, разрядность которого больше 16. Прежде всего, это неконтролируемое вами понижение разрядности (оно происходит втайне от вас или вы просто не обратили на него внимания). Допустим, сигнал проходит через три соединенных последовательно цифровых устройства обработки звука. Пусть для их соединения используется интерфейс S/PDIF. Внешне все кажется нормально: три красивых прибора соединены стандартными кабелями, все работает. Что еще нужно? Но кто-то из людей, коммутирующих эти устройства между собой, не разобрался в том, что только первый и последний приборы данной цепочки 24-битные, а средний 16-битный. Эти приборы легко нашли между собой язык: каждый из 24-битных приборов при установлении связи по S/PDIF выяснил, что подключен к 16-битному устройству и переключился в соответствующий режим. В результате при передаче сигнала от первого устройства ко второму произошел транкейт, причем персонал студии этого даже и не заметил. А как вы уже знаете, шум квантования 16-битного сигнала — вещь не очень приятная. Если в процессе обработки фонограммы транкейт происходит неоднократно, то качество звучания будет постепенно понижаться.

Вы скажете, что у вас нет своей цифровой студии с оборудованием стоимостью в десятки тысяч долларов. Но проблема транкейта может подстерегать вас и в персональной студии звукозаписи на базе PC. Обработали свой 24-битный WAV-файл 16-битным plug-in-модулем реверберации — вот вам и транкейт.

Рассмотрим процесс оцифровки и проблемы, которые могут возникнуть при выполнении этого процесса. Задачей этого процесса является преобразование аналогового сигнала в цифровой, причем захват и оцифровка одновременно участвуют в этом процессе. Поэтому с физической точки зрения термины оцифровка и захват стали использовать как синонимы.

В отличие от многих других компьютерных процессов захват видео происходит в реальном времени и не может быть ускорен или замедлен. В связи с этим обстоятельством может возникнуть множество проблем, ведущих к ухудшению качества оцифрованного видео.

Проблемы при захвате видео

Основным критерием возникновения ошибок при захвате видео является неподготовленность вашего компьютера для оцифровки. Рассмотрим два вида причин. Первой и наиболее частой является нехватка необходимых параметров в конфигурации вашего компьютера. Второй причиной может явиться неподготовленность ПО непосредственно к процессу. Это может быть одновременная работа сторонних программ, неподготовленный жесткий диск и т. п.

При захвате сигнала в реальном времени очень важно, чтобы информация не только была вовремя обработана процессором, но и успевала записываться на жесткий диск. Раньше, когда процессоры не обладали такой мощностью, чаще всего процесс захвата выставлялся без одновременного сжатия. Тогда процессор вполне успевал, но шла нагрузка на жесткий диск. Жесткий диск должен быть вполне достаточного объема, чтобы можно было на него записать несжатый файл даже небольшой временной продолжительности. Кроме того, жесткий диск обязательно форматировался в режим NTFS, так как режим FAT32 не допускает записи и хранения файлов размером более 4ГБ. Чтобы потом полученный файл сжать, требовалось тоже немало места для хранения кэш памяти при обработке файла. Такой процесс допускал захват только небольших по времени файлов. Потом они по отдельности сжимались, а уже потом «склеивались» друг с другом.

Благодаря сегодняшним технологиям, процессоры стали мощнее, а жесткие диски намного большего объема. Теперь появилась возможность производить захват и одновременно сжимать. Несмотря на это, ошибки при захвате все равно могут возникать. Рассмотрим основные причины, по которым могут возникать проблемы при оцифровке.

1. Недостаточная мощность процессора при сжатии (компрессии) происходит тогда, когда выбранный вами при захвате алгоритм компрессии не успевает сжимать кадр за 40 мс.

2. Недостаточная скорость записи на ваш жесткий диск. Может произойти из-за физических параметров самого диска или неподготовленности диска к работе. Если позволяют средства, то лучше поставить твёрдотельный диск (SSD), у которого скорость обмена данными намного выше (более чем в 10 раз).

Читайте также:  Как поставить ударение при печати

3. Недостаточный объем оперативной памяти, который может быть следствием физических параметров вашей ОП, а также загруженности более ранними процессами. В результате нехватки объема свободного пространства оперативная память начнет использовать часть жесткого диска, который и так находится под нагрузкой, записывая файл (причём в другие по расположению сектора).

4. На компьютере параллельно с захватом выполняются другие системные задачи, в результате которых ресурсы дисковой подсистемы и процессора снижаются.

5. Недостаточно качественное программное обеспечение, которое чаще всего идет в комплекте с самим устройством. Зачастую это ограниченные возможности той или иной программы. В последнее время почти все производители самих устройств исправили этот недостаток, и необходимость пользоваться сторонним профессиональным ПО практически отпала.

Все эти проблемы, в основном, ведут к выпадению кадров, а это, в свою очередь, ведет к потере синхронизации между аудио и видео. Захват аудио и видео происходит с помощью разных блоков, находящихся в устройстве захвата. Если происходит потеря кадров, значит, видео не будет сочетаться со звуком. В режиме цветности PAL за одну секунду проходит 25 кадров. Значит, потеря 25 кадров на всем временном протяжении вашего видео приведет к рассинхронизации аудио и видео на одну секунду. Какая потеря считается допустимой? Обычно это 5-7 пропущенных кадров на всем протяжении видео. Это то количество, при котором потеря синхронизации не особо заметна человеческим глазом. Если пропущено больше кадров, то лучше сделать захват заново.

Обратим внимание на формат AVI, представленный в виде контейнера, особенностью которого является постоянная частота кадров на протяжении всей видеозаписи. Стало быть, синхронизация в таком контейнере выполняется только один раз. Если происходят небольшие расхождения средней и реальной частоты даже на длительном отрезке видео, то процесс приводит к рассинхронизации видео и звука и становится заметным даже при несовпадении в 200мс. Выходом из такой ситуации является использование формата MPEG-2, у которого звук и видео неоднократно синхронизируются на протяжении всего видео.

При захвате звукового сопровождения рекомендуется использовать разжатый формат PCM, чтобы избежать потери синхронизации аудио- и видеопотоков. Это объясняется тем, что битрейт даже разжатого звука значительно меньше, чем видео, и при выборе формата PCM значительно легче избежать рассинхронизации, чем при сжатии звука «на лету». При монтаже сэмпл звуковой дорожки намного легче подогнать под видео именно в РСМ, чем в mp3 потому, что в mp3 длина сэмпла (кадра) равна 26мс, и звук следующего сэмпла зависит от конца предыдущего.
Теперь разберем методы устранения проблем при захвате видео.

Советы при захвате видео

1. Проверьте конфигурацию вашего компьютера для оцифровки и видеомонтажа.
2. Если ваш жесткий диск не отформатирован в систему NTFS — сделайте это.
3. Произведите дефрагментацию вашего жесткого диска, чтобы увеличить скорость записи, или воспользуйтесь диском SSD.
4. Проверьте наличие свободного места на диске. Его должно быть предостаточно.
5. Перезагрузите компьютер, тем самым очистив оперативную память от лишних процессов.
6. Проверьте работоспособность вашего компьютера. Запишите небольшой отрывок видео минут на 10 и проверьте качество полученного файла на выходе.
7. Поставьте формат выходящего видеофайла .mpg, используя кодек MPEG-2.
8. В качестве аудио-формата используйте формат PCM.
9. Во время захвата постарайтесь воздержаться от использования сторонних программ, не относящихся к захвату видео.

Еще следует учесть, что все выносные ТВ-тюнеры чаще всего используют для соединения с компьютером разъем USB, что само по себе является «узким местом» при проходе потока данных. Надо хотя бы проверить разъем вашего компьютера на работоспособность. А еще следует учесть, что в качественных DVD-рекордерах процесс захвата, оцифровки и записи на диск разработан профессионалами и практически не допускает таких проблем как потеря кадров и синхронизации, а также абсолютно не зависит от конфигурации вашего компьютера.

Звук– волна с непрерывно изменяющейся амплитудой и частотой.Чем больше амплитуда, тем он громче для человека, чем больше частота, тем выше тон.

Цифровой звук– это аналоговый звуковой сигнал, представленный посредством дискретных численных значений его амплитуды.

В основе кодирования звука с использованием компьютеров лежит процесс преобразования колебаний воздуха в колебания электрического тока и последующая дискретизация аналогового электрического сигнала.

Кодирование и воспроизведение звуковой информации осуществляется с помощью специальных программ (редакторы звукозаписи).

Качество воспроизведения закодированного звука зависит от частоты дискретизации и её разрешения.

Оцифровка звука— (или аналогово-цифровое преобразование) — технология преобразования аналогового звукового сигнала в цифровой вид, которая осуществляется путем замеров амплитуды сигнала с определенным временным шагом и последующей записи полученных значений в численном виде.

Оцифровка звука включает в себя два процесса:

процесс дискретизации (осуществление выборки сигнала по времени);

процесс квантования по амплитуде.

Процесс дискретизации по времени— процесс получения значений сигнала, который преобразуется с определенным временным шагом —шагом дискретизации.

Количество замеров величины сигнала, осуществляемых в одну секунду, называют частотой дискретизациииличастотой выборки, иличастотой семплирования(от англ. « ampling» — «выборка»).

Чем меньше шаг дискретизации, тем выше частота дискретизации и тем более точное представление о сигнале нами будет получено.

Процесс квантования по амплитуде — процесс замены реальных значений амплитуды сигнала значениями, приближенными с некоторой точностью.

Квантование– дискретизация по уровню.

Принимается, что погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными.

Каждый из 2 N возможных уровней называетсяуровнем квантования, а расстояние между двумя ближайшими уровнями квантования называетсяшагом квантования.

Число N называют разрядностью квантования, а полученные в результате округления значений амплитуды числа —отсчетами илисемплами(от англ. « sample» — «замер»).

Погрешности квантования, являющиеся результатом квантования с разрядностью 16 бит, остаются для слушателя почти незаметными.

Оцифровка звука – итог:

Плюсы:можно закодировать любой звук (в т.ч. голос, свист, шорох, …)

Минусы: есть потеря информации, большой объем файлов

Основные параметры, влияющие на качество звука:

1. Разрядность — размерность (количество бит информации кодируемое/декодируемое при АЦП и ЦАП).

2. Частота дискретизации— частота взятия отсчетов непрерывного во времени сигнала при его дискретизации (АЦП), измеряется в Герцах.

3. Шум — нежелательные фазовые и/или частотные случайные отклонения передаваемого сигнала

Форматы звуковых файлов

WAV(Waveform audio format), часто без сжатия (размер!)

MP3(MPEG-1 Audio Layer 3, сжатие с учётом восприятия человеком)

AAC (Advanced Audio Coding, 48 каналов, сжатие)

WMA (Windows Media Audio, потоковый звук, сжатие)

OGG (Ogg Vorbis, открытый формат, сжатие)