انبار داده تمیز شده

چطور یک Data Warehouse شلوغ و به‌هم‌ریخته را مرتب کنیم؟

یکی از مشکلات رایجی که در بسیاری از سازمان‌ها و تیم‌های داده دیده می‌شود، بهم‌ریختگی و عدم انسجام در Data Warehouse است. این مشکل معمولاً به مرور زمان و بر اثر رشد سریع تیم‌ها، تغییر نیازهای تحلیلی، ورود اعضای جدید بدون مستندسازی دقیق، و افزایش پروژه‌های موقتی به‌وجود می‌آید. نتیجه‌اش؟ یک انبار داده با ساختاری…

استراتژی پشتیبان‌گیری برای حفاظت از داده‌ها

از بحران تا پایداری: پشتیبان‌گیری و محافظت از داده‌ها در زمان صلح

چند هفته پیش ، در هیاهوی جنگ و بحران، با شما از اهمیت پشتیبان‌گیری (Backup) گفتم . از pg_dump و mysqldump تا mongoexport و rsync؛ از اینکه چگونه در شرایط بحرانی می‌توان جلوی از دست رفتن اطلاعات رو گرفت حالا که فضا کمی آرام‌تر شده، وقتشه که نگاه دوباره‌ای به این موضوع داشته باشیم ….

مهندسی داده در زمان جنگ

راهنمای پشتیبان‌گیری

واقعیتش این روزها که صدای انفجارهای پی‌در‌پی از گوشه گوشه کشور شنیده می‌شه، حال خوشی ندارم و کمتر از هر زمان دیگه‌ای دست و دلم به نوشتن پست جدید میره. ولی با توجه به شرایط بدی که پیش اومده و لزوم تهییه نسخه‌های پشتیبان از دیتای موجود روی سرورها و حتی نگهداریشون به صورت لوکال…

data pipeline

ساخت دیتا پایپ‌لاین مقیاس‌پذیر

از اسکریپت‌های پایتون و cron job گرفته تا سرویس‌های داکری ETL و Apache Airflow – گزارشی از مسیر من در ساخت دیتا پایپ لاین‌های مقیاس‌پذیر برای پروژه‌های تجاری. مناسب برای استفاده مهندسان داده