что означает частота дискретизации звука
Частота дискретизации
Чем выше частота дискретизации, тем более качественной будет оцифровка. Как следует из теоремы Котельникова для того чтобы однозначно восстановить исходный сигнал, частота дискретизации должна превышать наибольшую необходимую частоту сигнала в два раза.
8 000 Гц | телефон, достаточно для речи, кодек Nellymoser; |
11 025 Гц | — |
22 050 Гц | радио; |
44 100 Гц | используется в Audio CD; |
48 000 Гц | DVD, DAT; |
96 000 Гц | DVD-Audio (MLP 5.1); |
192 000 Гц | DVD-Audio (MLP 2.0); |
2 822 400 Гц | SACD Super audio CD 5.1 — максимальная на 2008 год. |
Взаимосвязь качества звука и частоты дискретизации [ править ]
Преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантования по амплитуде. Дискретизация по времени означает, что сигнал представляется рядом отсчетов (сэмплов), взятых через равные промежутки времени. Например, когда мы говорим, что частота дискретизации 44,1 кГц, то это значит, что сигнал измеряется 44 100 раз в течение одной секунды.
Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового сигнала. Чем больше частота, тем точнее соответствует цифровой сигнал аналоговому. Однако пропорционально увеличению частоты возрастают:
Очевидно, что необходим компромисс. От выбора частоты дискретизации зависит частотный диапазон полученного цифрового звука и максимальная частота аналогового сигнала, правильно представленная в цифровом. Считается, что человек слышит частоты в диапазоне от 20 до 20 000 Гц. Согласно известной теореме Котельникова, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты.
Звуковая частота, равная половине частоты дискретизации, называется частотой Найквиста и является максимальной частотой, которую данная цифровая система может правильно сохранить и воспроизвести. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 до 20 кГц, то частота дискретизации такого сигнала должна быть не менее 40 кГц. Сегодня самыми распространенными частотами дискретизации являютcя 44,1 кГц (CD) и 48 кГц (DAT).
Частота дискретизации при оцифровке
Частота дискретизации – частота выборки отсчетов сигнала при оцифровке.
Частоту дискретизации еще называют частотой сэмплирования (sample rate).
Для большего понимания этого понятия давайте посмотрим на рисунок, на котором представлена форма волны сигнала.
Значения «O» представляет собой один отсчет – промежуток времени отдельно взятого сэмпла. А частота дискретизации показывает сколько отсчетов (сэмплов одинаковой продлжительности «O») взято за одну секунду.
Если оцифрованный сигнал имеет частоту дискретизации 48 кГц, то это означает, что каждая секунда этого сигнала разбита на 48000 отсчетов.
Например трэк продолжительностью 7 мин (420 секунд) с частотой сэмплирования 48 кГц будет иметь 20160000 отсчетов (420х48000).
Из выше сказанного можно сделать вывод, что чем больше частота дискретизации, тем выше качество аудиосигнала. Но при выборе больших значений sample rate при преобразовании аудиосигнала повышается интенсивность потока цифровых данных и нагрузка на цифровые процессы обработки информации, а также увеличивается объем результирующего файла.
Учитывая теорему Найквиста (в любой системе, осуществляющей дискретизацию по времени частота дискретизации должна быть как минимум в два раза больше чем наибольшая частота, которую необходимо передать) и то, что человек может слышать звук в диапазоне 20 – 20000 Гц, то можно сказать, что для качественного преобразования аналогового сигнала в цифровой будет достаточно использовать частоту дискретизации в 44,1 кГц (44100/2 = 22050).
Напоследок приведу несколько примеров использования частоты дискретизации звука.
— 8 000 Гц – телефон (частота достаточная для передачи речи);
Цифровой аудиоформат 24/192, и почему в нем нет смысла. Часть 2 [Перевод]
Сохранить и прочитать потом —
Прим. перев.: Это перевод второй (из четырех) частей развернутой статьи Кристофера «Монти» Монтгомери (создателя Ogg Free Software и Vorbis) о том, что, по его мнению, является одним из наиболее распространенных и глубоко укоренившихся заблуждений в мире меломанов.
Частота 192 кГц считается вредной
Музыкальные цифровые файлы с частотой 192 кГц не приносят никакой выгоды, но всё же оказывают кое-какое влияние. На практике оказывается, что их качество воспроизведения немного хуже, а во время воспроизведения возникают ультразвуковые волны.
И аудиопреобразователи, и усилители мощности подвержены влиянию искажений, а искажения, как правило, быстро нарастают на высоких и низких частотах. Если один и тот же динамик воспроизводит ультразвук наряду с частотами из слышимого диапазона, то любая нелинейная характеристика будет сдвигать часть ультразвукового диапазона в слышимый спектр в виде неупорядоченных неконтролируемых нелинейных искажений, охватывающих весь слышимый звуковой диапазон. Нелинейность в усилителе мощности приведет к такому же эффекту. Эти эффекты трудно заметить, но тесты подтвердили, что оба вида искажений можно расслышать.
График выше показывает искажения, полученные в результате интермодуляции звука частотой 30 кГц и 33 кГц в теоретическом усилителе с неизменным коэффициентом нелинейных искажений (КНИ) около 0.09%. Искажения видны на протяжении всего спектра, даже на меньших частотах.
Неслышимые ультразвуковые волны способствуют интермодуляционным искажениям в слышимом диапазоне (светло-синяя зона). Системы, не предназначенные для воспроизведения ультразвука, обычно имеют более высокие уровни искажений, около 20 кГц, дополнительно внося вклад в интермодуляцию. Расширение диапазона частот для включения в него ультразвука требует компромиссов, которые уменьшат шум и активность искажений в пределах слышимого спектра, но в любом случае ненужное воспроизведение ультразвуковой составляющей ухудшит качество воспроизведения.
Все эти способы нацелены на решение одной проблемы, но только 4 способ имеет какой-то смысл.
Если вам интересны возможности вашей собственной системы, то нижеследующие сэмплы содержат: звук частотой 30 кГц и 33 кГц в формате 24/96 WAV, более длинную версию в формате FLAC, несколько мелодий и нарезку обычных песен с частотой, приведенной к 24 кГц так, что они полностью попадают в ультразвуковой диапазон от 24 кГц до 46 кГц.
Предположим, что ваша система способна воспроизводить все форматы с частотами дискретизации 96 кГц [6]. При воспроизведении вышеуказанных файлов, вы не должны слышать ничего, ни шума, ни свиста, ни щелчков или каких других звуков. Если вы слышите что-то, то ваша система имеет нелинейную характеристику и вызывает слышимые нелинейные искажения ультразвука. Будьте осторожны при увеличении громкости, если вы попадете в зону цифрового или аналогового ограничения уровня сигнала, даже мягкого, то это может вызвать громкий интермодуляционный шум.
В целом, не факт, что нелинейные искажения от ультразвука будут слышимы на конкретной системе. Вносимые искажения могут быть как незначительны, так и довольно заметны. В любом случае, ультразвуковая составляющая никогда не является достоинством, и во множестве аудиосистем приведет к сильному снижению качества воспроизведения звука. В системах, которым она не вредит, возможность обработки ультразвука можно сохранить, а можно вместо этого пустить ресурс на улучшение качества звучания слышимого диапазона.
Недопонимание процесса дискретизации
Теория дискретизации часто непонятна без контекста обработки сигналов. И неудивительно, что большинство людей, даже гениальные доктора наук в других областях, обычно не понимают её. Также неудивительно, что множество людей даже не осознают, что понимают её неправильно.
Дискретизированные сигналы часто изображают в виде неровной лесенки, как на рисунке выше (красным цветом), которая выглядит как грубое приближение к оригинальному сигналу. Однако такое представление является математически точным, и когда происходит преобразование в аналоговый сигнал, его график становится гладким (голубая линия на рисунке).
Наиболее распространенное заблуждение заключается в том, что, якобы, дискретизация – процесс грубый и приводит к потерям информации. Дискретный сигнал часто изображается как зубчатая, угловатая ступенчатая копия оригинальной идеально гладкой волны. Если вы так считаете, то можете считать, что чем больше частота дискретизации (и чем больше бит на отсчет), тем меньше будут ступеньки и тем точнее будет приближение. Цифровой сигнал будет все больше напоминать по форме аналоговый, пока не примет его форму при частоте дискретизации, стремящейся к бесконечности.
По аналогии, множество людей, не имеющих отношения к цифровой обработке сигналов, взглянув на изображение ниже, скажут: «Фу!» Может показаться, что дискретный сигнал плохо представляет высокие частоты аналоговой волны, или, другими словами, при увеличении частоты звука, качество дискретизации падает, и частотная характеристика ухудшается или становится чувствительной к фазе входного сигнала.
Это только так выглядит. Эти убеждения неверны!
Комментарий от 04.04.2013: В качестве ответа на всю почту, касательно цифровых сигналов и ступенек, которую я получил, покажу реальное поведение цифрового сигнала на реальном оборудовании в нашем видео Digital Show & Tell, поэтому можете не верить мне на слово.
Все сигналы частотой ниже частоты Найквиста (половина частоты дискретизации) в ходе дискретизации будут захвачены идеально и полностью, и бесконечно высокая частота дискретизации для этого не нужна. Дискретизация не влияет на частотную характеристику или фазу. Аналоговый сигнал может быть восстановлен без потерь – таким же гладким и синхронным как оригинальный.
С математикой не поспоришь, но в чем же сложности? Наиболее известной является требование ограничения полосы. Сигналы с частотами выше частоты Найквиста должны быть отфильтрованы перед дискретизацией, чтобы избежать искажения из-за наложения спектров. В роли этого фильтра выступает печально известный сглаживающий фильтр. Подавление помехи дискретизации, на практике, не может пройти идеально, но современные технологии позволяют подойти к идеальному результату очень близко. А мы подошли к избыточной дискретизации.
Частоты дискретизации свыше 48 кГц не имеют отношения к высокой точности воспроизведения аудио, но они необходимы для некоторых современных технологий. Избыточная дискретизация (передискретизация) – наиболее значимая из них [7].
Идея передискретизации проста и изящна. Вы можете помнить из моего видео «Цифровое мультимедиа. Пособие для начинающих гиков», что высокие частоты дискретизации обеспечивают гораздо больший разрыв между высшей частотой, которая нас волнует (20 кГц) и частотой Найквиста (половина частоты дискретизации). Это позволяет пользоваться более простыми и более надежными фильтрами сглаживания и увеличить точность воспроизведения. Это дополнительное пространство между 20 кГц и частотой Найквиста, по существу, просто амортизатор для аналогового фильтра.
На рисунке выше представлены диаграммы из видео «Цифровое мультимедиа. Пособие для начинающих гиков», иллюстрирующие ширину переходной полосы для ЦАП или АЦП при частоте 48 кГц (слева) и 96 кГц (справа).
Это только половина дела, потому что цифровые фильтры имеют меньше практических ограничений в отличие от аналоговых, и мы можем завершить сглаживание с большей точностью и эффективностью. Высокочастотный необработанный сигнал проходит сквозь цифровой сглаживающий фильтр, который не испытывает проблем с размещением переходной полосы фильтра в ограниченном пространстве. После того, как сглаживание завершено, дополнительные дискретные отрезки в амортизирующем пространстве просто откидываются. Воспроизведение передискретизированного сигнала проходит в обратном порядке.
Это означает, что сигналы с низкой частотой дискретизации (44.1 кГц или 48 кГц) могут обладать такой же точностью воспроизведения, гладкостью АЧХ и низким уровнем наложений, как сигналы с частотой дискретизации 192 кГц или выше, но при этом не будет проявляться ни один из их недостатков (ультразвуковые волны, вызывающие интермодуляционные искажения, увеличенный размер файлов). Почти все современные ЦАП и АЦП производят избыточную дискретизацию на очень высоких скоростях, и мало кто об этом знает, потому что это происходит автоматически внутри устройства.
ЦАП и АЦП не всегда умели передискретизировать. Тридцать лет назад некоторые звукозаписывающие консоли использовали для звукозаписи высокие частоты дискретизации, используя только аналоговые фильтры. Этот высокочастотный сигнал потом использовался для создания мастер-дисков. Цифровое сглаживание и децимация (повторная дискретизация с более низкой частотой для CD и DAT) происходили на последнем этапе создания записи. Это могло стать одной из ранних причин, почему частоты дискретизации 96 кГц и 192 кГц стали ассоциироваться с производством профессиональных звукозаписей.
16 бит против 24 бит
Хорошо, теперь мы знаем, что сохранять музыку в формате 192 кГц не имеет смысла. Тема закрыта. Но что насчет 16-битного и 24-битного аудио? Что же лучше?
16-битное аудио с импульсно-кодовой модуляцией действительно не полностью покрывает теоретический динамический звуковой диапазон, который способен слышать человек в идеальных условиях. Также есть (и будут всегда) причины использовать больше 16 бит для записи аудио.
Ни одна из этих причин не имеет отношения к воспроизведению звука – в этой ситуации 24-битное аудио настолько же бесполезно, как и дискретизация на 192 кГц. Хорошей новостью является тот факт, что использование 24-битного квантования не вредит качеству звучания, а просто не делает его хуже и занимает лишнее место.
Примечания к Части 2
6. Многие из систем, которые неспособны воспроизводить сэмплы 96 кГц, не будут отказываться их воспроизводить, а будут незаметно субдискретизировать их до частоты 48 кГц. В этом случае звук не будет воспроизводиться совсем, и на записи ничего не будет, вне зависимости от степени нелинейности системы.
7. Передискретизация – не единственный способ работы с высокими частотами дискретизации в обработке сигналов. Есть несколько теоретических способов получить ограниченный по полосе звук с высокой частотой дискретизации и избежать децимации, даже если позже он будет субдискретизирован для записи на диски. Пока неясно, используются ли такие способы на практике, поскольку разработки большинства профессиональных установок держатся в секрете.
8. Неважно, исторически так сложилось или нет, но многие специалисты сегодня используют высокие разрешения, потому что ошибочно полагают, что звук с сохраненным содержимым за пределами 20 кГц звучит лучше. Прямо как потребители.
Записывая звук, выбираем оптимальную частоту. Полезная информация
Не только новичкам, но и некоторым энтузиастам, занимающихся звуком много лет, покажется откровением тот факт, что банальный процесс записи сопровождается сложнейшими физическими явлениями. Одним из таковых называют дискретизацию. Согласно определению, она представляет собой процесс преобразования непрерывной функции в дискретную. Людям, далёким от науки, это понять сложно, тем более, здесь задействована квантовая физика – самая сложная из существующих на сегодняшний день. Но профессиональные звукорежиссёры, например, работающие в московской студии звукозаписи «Интервал», знают, что такое частота дискретизации звука, какая лучше применима в тех или иных случаях. Почему? Потому что от этого явления зависит конечное качество записываемой музыки. В кассетно-плёночный период эти нюансы, ввиду ограниченной технической оснащённости, опускались. Но в современном высокотехнологичном цифровом мире частота дискретизации звука имеет значение при создании музыки и демонстрации её слушателям.
Детализация понятий
Что такое разрядность и частота дискретизации, какая лучше? Ответ на данный вопрос, несмотря на сложность природы этих явлений, получить можно. При этом нет необходимости штудировать учебники по физике. Достаточно вспомнить, что советскими полуподпольными звукорежиссёрами, записывающими рок и другую музыку, эти показатели определялись на интуитивном уровне. Дискретизацию ещё называют сэмплированием. Это определение более понятно для музыкантов. Её частота подразумевает интенсивность процессов в тот момент, когда аналоговый сигнал преобразуется в цифровой. Среди них хранение данных, конвертация, и непосредственно оцифровка.
Частота дискретизации измеряется в герцах. Ориентиром в её изучении является теорема Котельникова. Её автор раскрывает суть дискретизации. Согласно теореме, она ограничивает интенсивность оцифрованного сигнала до половины собственной величины.
Частота дискретизации. В чём её значение для звукозаписи
Дискретизация по времени – это процесс, который непосредственно связан преобразованием аналогового сигнала в цифровой. Наряду с ней происходит квантование данных по амплитуде. Дискретизация по времени означает измерение сигнала в момент всей его передачи. В качестве единицы берётся один сэмпл. Если на словах это не совсем понятно, то на примере выглядит более убедительно. Допустим, частота дискредитации равняется 44100 Гц – та самая, которая применялась на аудио-CD. Это означает, что сигнал измеряется 44100 раз в течение одной секунды.
Аналоговый сигнал по своей насыщенности всегда превосходит цифровой. И его преобразование – это неизбежная потеря в качестве. Частота дискретизации служит своеобразным ориентиром: чем она выше, тем ближе качество цифрового звука к аналоговому. Это явственно просматривается в списке ниже. Он показывает, какая частота звука лучше. Изучая его, вы увидите непосредственную взаимосвязь дискретизации и качества трека:
Список чётко указывает на то, какая частота звука лучше. К тому же технологии на месте не стоят, и появляются новейшие форматы. Но прежде чем строить далеко идущие планы, следует учесть один очень весомый нюанс. Его суть проста: чем выше частота дискретизации, тем сложнее её достичь технологически. Для этого необходимо:
Учитывая вышеизложенную информацию, неудивительным является тот факт, что частота звука, равная 44100 Гц, продолжает оставаться наиболее востребованной и сегодня. Она десятилетиями удовлетворяет даже самые взыскательные запросы к качеству, и вместе с тем имеются все технические возможности для её достижения. Последний фактор является определяющим как для рядовых пользователей, так и для большинства звукозаписывающих студий. Даже зная, какая частота звука лучше, чтобы достигнуть её, необходимо позаботиться о технической оснащённости.
Так ли хорош цифровой звук — частота дискретизации и теорема Котельникова
Часто производители аудио аппаратуры, особенно наушников, в процессе пиара своей продукции активно продвигают “кристальную чистоту” звука и широчайший частотный диапазон, который не только за 20 кГц переваливает, но и в некоторых случаях доходит даже до 100 кГц. Конечно это имеет свои плюсы, даже не смотря на то, что выше 20к Гц мы не слышим, а то и еще меньше. Но есть определенные проблемы, которые связанны с понятием частота дискретизации и вытекающие из теоремы Котельникова. Они в одночасье поставили жирный крест на применении слова “качественно” для большинства аудио-форматов и аудио устройств в моих глазах.
Любой процесс в природе является непрерывным. Например звуковой сигнал принятый микрофоном и преобразованный в электрический (аналоговый) сигнал — непрерывен.
Термин “Аналоговый сигнал” подчеркивает, что такой сигнал “аналогичен”, т.е. полностью подобен порождающему его процессу, или в данном случае звуку.
И непрерывный он не потому что будет длиться вечно, а потому, что его значение можно измерять в любые моменты времени. А между этими моментами сигнал будет продолжать непрерывно меняться.
Для лучшего понимания того, как устроен цифровой звук, советую посмотреть мой видос:
Что такое частота дискретизации?
Как только встает вопрос о переводе аналогового сигнала в цифровой, сразу возникает понятие дискретизации, т.е. разбиение непрерывного сигнала на кусочки по времени. Делается это непосредственно в процессе преобразования.
Через равные промежутки времени, называемые шагом дискретизации Δ, Аналогово-Цифровой-Преобразователь (АЦП) измеряет значение сигнала, поступающего на его вход и преобразует это значение в цифровой вид. То, как часто осуществляется измерение величины аналогово сигнала и называется частотой дискретизации.
Какая частота дискретизации считается достаточной?
Товарищ Котельников, еще в 1933 в работе «О пропускной способности эфира и проволоки в электросвязи» создал фундаментальную, для цифровой техники теорию, которая обычно формулируется следующим образом:
Лю бой непрерывный сигнал u(t) с конечным спектром (имеющим максимальное значение частоты F ) можно представить в виде дискретных отсчетов u(kΔt) , частота дискретизации которых должна быть выбрана не менее чем в два раза выше максимального значения спектра сигнала: f ≥ 2F , передать его по линии связи, а затем восстановить исходный аналоговый сигнал .
Говоря проще, для того чтобы можно было правильно воспроизвести (восстановить) аналоговый сигнал из цифрового вида, достаточно, чтобы частота дискретизации была вдвое выше максимальной частоты в сигнале.
Верхний порог слышимости человека принято ограничивать частотой в 20кГц. Из теоремы Котельникова следует, что для правильного воспроизведения сигнала частотой 20 кГц достаточно частоты дискретизации в 40кГц. Если заглянуть в свойства подавляющего большинства аудио файлов, то можно увидеть строчку:
Почему именно 44.1 кГц? Википедия отвечает так: “Эта цифра выбрана компанией Sony из соображений совместимости со стандартом телевещания PAL, за счёт записи 3 значений на линию картинки кадра x588 линий на кадр x25 кадров в секунду, и достаточности (по теореме Котельникова) для качественного покрытия всего диапазона частот, различаемых человеком на слух (20 Гц — 20 кГц).”
Вроде все нормально, так чего же тут не так?
Начнем с частот, кратных частоте дискретизации. На частоте 441 Герц при нашей частоте дискретизации (44.1 кГц), на один период приходится 100 точек. Чтож, тут нет никаких претензий, синусоида идеальная. Если же повысить частоту на порядок, т.е. в 10 раз, то эти же 100 точек будут формировать уже не 1, а 10 периодов. И даже в этом случае Будет формироваться сигнал очень похожий на синусоиду.
А вот на частоте 22050, т.е. наивысшей частоте, удовлетворяющей теореме Котельникова (при частоте дискретизации 44.1кГц) на 100 точек приходится 50 периодов колебаний.
Эти сигналы генерировались в программе Audacity. И по началу создалось впечатление, что точек там достаточно, просто масштаб не позволяет разглядеть и поэтому так все угловато…
Чтож… приблизим и рассмотрим каждый период по отдельности:
Частота в 4410 Гц вполне себе достойная синусоида, чего никак не скажешь о частоте 22050Гц, с ее двумя точками на период. По факту это уже и не синусоида, а сигнал треугольной формы.
Конечно в любом реальном ЦАПе на выходе применяется НЧ-фильт, который срезает высокочастотную составляющую и скругляет этот треугольник. Однако чем выше класс вашего аудио устройства, тем заметнее будет угловатость звука
Ради эксперимента можете попробовать сгенерировать в Audcity сигналы одной и той же частоты но разных форм. У треугольной и прямоугольной форм из-за их “угловатости” и резких фронтов возникают дополнительные гармоники, а вот синусоидальный сигнал звучит гораздо более мягко и естественно.
Но даже и это не самое страшное. До этого момента рассматривались сигналы с частотами кратными частоте дискретизации.
— А что же будет, если взять другие частоты.
Знакомьтесь, цифровая синусоида равной амплитуды и частотой 15 кГц. Красивый узорчик, не правда ли? Как видите амплитуда меняется с частотой. Это уже интермодуляционные искажения. Наш истинный сигнал в 15 кГц промодулирован частотой кратной 44.1 кГц.
Вы можете возразить, мол узорчик то красивый, но может звучит он как ему и положено. Для того чтобы убедиться в этом своими ушами — сгенерируйте сигнал частота которого меняется от 20 герц до 20 кГц. И вы отчетливо услышите, что с какого-то момента частота перестанет равномерно расти, а начнет плавать туда-сюда.
Оно и понятно, вот так выглядят синусоиды на разных частотах выше 10’000Гц
В защиту теоремы Котельникова стоит отметить, что да, его теорема верна, иначе бы мы не смогли различать в музыке высокие звуки, и что тарелка что маракас звучали бы одинаково неправдоподобно, но она абсолютно не гарантирует высокого качества записи.
В жизни Вы врядли станете наслаждаться звучанием синусоиды, но это был очень наглядный пример проблем качества цифровых аудио записей.
Частота дискретизации и Hi-Res звук
Конечно сегодняшние технологии уже побороли данную проблему. Вероятно вам встречалось сокращение Hi-Res (High Resolution — высокое разрешение), которым обычно обзывают качество звука в 24 бита и частотой дискретизации в 192 кГц.
А это уже 10 точек на частоте 22’050 кГц, такую синусоиду уже явно можно считать идеальной. И вот там «кристально чистые верха» ваших наушников себя точно оправдают.
Возникает только 3 проблемы:
В заключение
Конечно от плохого звучания высоких частот еще никто не умирал и, возможно я излишне драматизирую, говоря, что частота дискретизации в 44.1 кГц так уж плоха, однако, как видите особым качеством на высоких частотах она не блещет.
На мой взгляд в домашних условиях гораздо интереснее слушать винил. Но с виниловой вертушкой в метро не поездишь… Так что меломанские запросы придется удовлетворять цифровым плеером.
Всем качественного звука!
(P.S. — комментируем, не стесняемся 🙂
Мдя, против логики не попрёшь: на 20000 Гц при дискретизации 40000 будет тупо треугольный сигнал…
Так просто о звуковых сложностях не доводилось читать, спасибо!
Рад, что вам понравилось. Значит не просто так все это) Я сам не сильно задумывался о частоте дискретизации, обычно больше на битность обращал внимание, а когда случайно обнаружил что синус совсем не синус, понял какая это оказывается какашка(((
Спасибо,немножко взгруснулось что надо покупать дорогую аппаратуру))
Спасибо за доступное объяснение!
спасибо за тему, на дискретность не обращал внимания к звуку, всегда выбирал по битности, так досконально в картинках в наше время не видел, лет 20 назад попадались такие темы, но как то не принимал всерьез, для выбора осциллографа было нормой, а со звуком не связывал, уважуха!
Спасибо за комментарий!
Интерес к этому вопросу возник после того, как решил посмотреть осцилографом на выходной сигнал плеера на высоких частотах…
Сгенерировал трек, у которого частота плавно менялась от 10 до 20кГц в течении минуты, подал сигнал с выхода плеера на осцилографф, и наблюдал, как там все красиво плавает…
Добрый вечер Андрей.
Случайно наткнулся на вашу статью, давно интересовался данным вопросом, могу пояснить некоторые ваши интересные наблюдения:
1) Мало кто про это знает и понимает, но для восстановления сигнала в теореме Котельникова необходимо указывать строгое неравенство, по обозначениям в Вашей статье должны быть f > 2F. Поэтому при частоте дискретизации 44.1кГц вы синусойду с частотой 22,05 Гц корректно не восстановите.
2) При дискретизации частотой некратной, никаких интермодуляционных искажений не будет. В соответствии с теоремой Котельникова сигнал восстановится теоретически точно, без погрешности. Однако это будет только в том случае, если мы будем использовать фильтры с идеальными характеристиками. Поскольку все реальные фильтры имеют АЧХ неидеальную, сигнал восстанавливается с искажениями. Чем больше будет браться частота дискретизации, тем меньше будет этих искажений. Поэтому при частоте дискретизации в 192 кГц качество звука для сигналов с высокими частотами на порядок выше.
Здравствуйте, Дмитрий!
Спасибо за Ваш развернутый комментарий.
1. Да, я согласен, что там должно стоять строгое неравенство и начиная с частоты в 22,05 кГц — это условие и не выполняется.
На той же википедии при этом приводится такая выдержка из работы Котельникова:
Любую функцию f(t), состоящую из частот от 0 до fc, можно непрерывно передавать с любой точностью при помощи чисел, следующих друг за другом через 1/2fc секунд
Т.е. частоту fc можно передавать с любой точностью при частоте дискретизации вдвое больше самой fc.
Так или иначе те же 20 кГц тоже очень далеки от правдоподобности.
2. И тут я с Вами согласен!) В идеале на выходе цифро аналогового преобразователя должны стоят фильтры 6-8 порядка, которые не только трудно реализуемы но еще и вносят существенный вклад в искажение как частотной так и фазовой характеристики. Поэтому в качестве альтернативы обычно обходятся фильтром 2-го порядка. А он все-таки не может полноценно срезать все лишнее.
По крайней мере, глядя осциллографом на выходе моего HiFiMan HM-601 я наблюдал немного сглаженные, но в целом такие же картинки, как и приводятся в статье.
Однако сегодня существуют не только аналоговые, но и цифровые фильтры, способные обеспечить очень крутой срез всех частот выше слышимых. Однако это уже несколько сложнее и дороже.
__________
Почему же не будет интермодуляционных искажений? Если посмотреть на картинки частот не кратных частоте дискретизации, то отчетливо видно что точки идут волнами. А частота этих волн и есть частота дискретизации. Соответственно полезный сигнал промодулирован частотой дискретизации.
Я вам даже больше скажу, если сгенерировать сигнал плавно меняющийся от 20 Гц до 20кГц, то это становится даже слышно, примерное после 10кГц частота, по ощущениям, начинает плавать туда сюда вместо плавного роста.
Добрый вечер, вы также не учли то что звуковой сигнал при оцифровке не будет синхронный с дискретизацией, например при рассинхроне в пол периода частоты дискретизации вместо треугольников у вас получится ровная линия.
Кому-то Бог дал уши, а кому-то — теорему Котельникова.
С Вашего позволения расскажу давнишнюю историю. Сейчас кажется, что это было сто лет назад, но на самом деле немного меньше. Был пик расцвета аналогового аудио. Я случайно в неурочное время оказался возле одного стенда на выставке достижений народного хозяйства. Японского народа… Сама выставка еще не открылась, а только монтировались стенды. Был конец дня. На стенде была представлена акустическая система с усилителем. Верхняя частота передачи колонок — 70кГц, усилителя — 100кГц. Через эту систему играла музыка от стоящего в углу катушечного магнитофона. Рядом сидел пожилой японец, слушал музыку и пил, что-то, принесенное в термосе. Звук был, надо отдать должное, впечатляющий. Такая вот обстановка. Ну и я тут, весь такой умный, все знающий — второй Котельников. Спрашиваю — а чтой-то за неувязочка у Вас тут, гражданин уважаемый — усилитель до 100кГц, колонки — до 70-ти, а слышим мы и подавно до 20-ти? Японец оказался не просто представителем производителя, а инженером-разработчиком. Он подозвал переводчика, тот ему перевел мой вопрос и, как это не поразительно, японец мне ответил. Первая часть ответа состояла из того, что интерференция колебаний вызывает образование суммарных и разностных частот. Если сделать тракт с полосой пропускания в пределах слышимости, например, до 20 кГц, то мы потеряем частоту 5кГц, если на вход будет подано 2 частоты — 20кГц и 25кГц. В этот момент переводчика у нас отняли, но японцу, почему-то, захотелось, что бы я понял его концепцию. Уже на плохом английском, жестикулируя и рисуя в блокноте, он говорил про передачу фазовой информации в звуке, о влиянии фазовых искажений на звуковую картину, про альтернативное видение окружающего пространства при помощи слуха…
Теорема Котельникова должна применяться после понимания того, какую информацию из колебаний мы хотим восстановить. И если у Вас есть уши — им необходим объем звуковой информации бОльший на порядок. Звуковая сцена, окружающее пространство — это фазовая информация, которая только начинает появляться при разрешении 18бит 96кГц. Удачи всем!
Спасибо за ваш полезный и глубокий комментарий!
Вы несомненно правы! Я както даже не задумывался с этой точки зрения. Так что еще раз спасибо!)
треугольный сигнал на 20 кГц, появляются гармоники которые портят звук… Оч интересно..а гармоники имеют частоту выше чем 20 кГц или ниже?….а? Каким ухом вы собираетесь их слышать?
Конечно же, на выходе любого ЦАПа стоит ФНЧ, который скругляет этот треугольник, приближая его к синусу.
Вот только для полноценного избавления от лишнего цифрового мусора, порождаемого ЦАПом, нужен ФНЧ с частотой среза 20кГц, обеспечивающий затухание сигнала в 30-40 дБ, к часте дискретизации в 44кГц. Построение подобного аналогово фильтра технически очень сложная и муторная задача, поэтому все чаще прибегают к цифровым фильтрам и псевдо учетверению частоты дескретизации.
А все это нужно, чтобы какраз таки убрать гармоники, лежащие на частотах, кратных частоте дескритизации 44к, 88к… Которые хоть и лежат за пределами слышимого диапазона, но оказывают влияние на него.
Наверное все это не просто так делается, мм?
«а гармоники имеют частоту выше чем 20 кГц или ниже?….а? Каким ухом вы собираетесь их слышать?» — Дмитрий, это называется «я не читатель, я- писатель». Простите.
Если речь идет о гармониках, связанных с АЦП, то они в Вашем примере займут весь спектр от 0 Гц до нескольких МГц, по причине их нечетности и способности складываться, вычитаться (в том числе и с исходным сигналом) и много еще чего делать в нелинейном тракте. Спектральное распределение шума Вы можете посмотреть, подключив анализатор. Неплохо от него избавляются специальными алгоритмами, вычитающими в несколько итераций спектр, который должен быть образован гармониками, из исходного сигнала. Недостаток метода — дороговизна и привязка к конкретному аппаратному тракту. Так же существуют менее точные, но более универсальные аппаратные аналоги этого решения (Burr-Brown, Tripath…), использующие введение обратной связи, но которые, тем не менее, являются общепризнанными стандартами высокого качества, прежде всего в передаче звука.