Google Refine - мощный инструмент для работы со смешанными данными, их очистки, организации, преобразования, дополнения с использованием веб-сервисов и загрузки в базы данных, вроде Freebase.
Dan Nguyen дал ещё одно определение Google Refine: средство от головной боли, усталости глаз, депрессии и других симптомов многочасовой работы по очистке данных.
Google Refine:
- могут использовать люди без навыков программирования и работы с базами данных;
- бесплатен;
- запускается на любом компьютере, работает в браузере и использует интерфейс, похожий на Google Docs;
- несмотря на то, что инструмент придуман Google, он работает автономно и не требует отправки данных в интернет;
- куча полезных функций, включая историю изменений и их отмены, визуализацию характеристик данных; фильтры, кластеризацию, самые разные преобразования и использование простого языка выражений Google Refine Expression Language (GREL).