Добрый день!
Вообще, задача на самом деле очень нетривиальная. Сейчас поясню:
1. Как понять, что трек дубликат? Сравнивать файлы побитово? Ну так они практически никогда биться между собой не будут, т.к. разные кодеки, пресеты, метаданные. Сравнивать метаданные? Это ближе, но на рутрекере не всегда набивают метаданные с официальной базы, а вместо этого лепят то, что сами хотят. Соответственно, при поиске нужно учитывать небольшую разницу в метаданных.
2. Как исключить одинаково названные треки, но которые отличаются? Бывает, что трек назван одинаково, но есть студийная версия и live версия. А по тем же метаданным непонятно. Как исключить такие случаи?
Я к чему веду - ручками поработать все равно придется.
Помню, лет десять я также хотел заморочиться - потом оценил объем работы и понял, что нафиг это не надо.
Чисто теоретически можно делать это ручками по мере роста коллекции музыки, но я так не делал, а когда музыки накопилось очень много, то перебирать эту кучу уже желания нет.
Ну и для поиска дубликатов советую эту программу:
Duplicate Files Search & Link. Если не ошибаюсь, она даже умеет искать дубли без учета метаданных, что в принципе должно Вам помочь.