Как перекодировать cp1251 в UTF-8

Небольшая заметка, посвящённая борьбе с засильем кодировки cp1251, которая фактически стала стандартом де-факто благодаря операционной системе Windows и её многочисленным адептам. Кодировать будем под ОС Linux. Не волнуйтесь, это не займёт много сил и не подорвёт вашего душевного равновесия.

Момент первый.

Когда нужно перекодировать текст (.txt, .php, .css или что-то в этом духе) Идём в директорию, где лежат файлы, подлежащие преобразованию, например:

$ cd ~/Documents

После чего даём команду:

$ find . -name "*.txt" -exec recode CP1251/..UTF-8 {} \;

Или для перекодировки единственного файла:

$ enconv -x UTF-8 myfile.txt

Момент второй. Перекодировка mp3 тегов

Тут должен быть установлен пакет mutagen. Для перекодирования тегов mp3-коллекции из кодировки CP1251 в UTF-8 перейдите в нужную директорию и выполните ещё одну команду:

$ find -iname '*.mp3' -print0 | xargs -0 mid3iconv -eCP1251 --remove-v1

Вот и всё.