يدور موضوع الحلقة حول ثلاث أدوات "ثقيلة" ومتقدمة تهدف إلى إدارة البيانات الضخمة(Big Data) وضمان جودتها: PySpark، وDVC، وGreat Expectations.1. PySpark (سيد البيانات الضخمة)الغرض الرئيسي: معالجة البيانات الضخمة (Petabytes) من خلال المعالجة الموزعة (Distributed Computing) والتوسع ( ...Show more
أدوات هتغير حياتك كعالم بيانات
تناقش الحلقة فكرة أن نجاح مشاريع علم البيانات لا يعتمد فقط على مهارة كتابة الكود (مثل Python وSQL)، بل على استخدام الأدوات المناسبة لتنظيم العمل وجعله قابلًا للتطوير (Scalable).الأدوات الثلاثة التي تم تسليط الضوء عليها هي:Polars (السرعة هي الملك):الوصف: مكتبة بُنيت بلغة Rust وتُ ...Show more
كيف ممكن نشوف المستقبل؟ و هل اصلا ممكن نشوف المستقبل؟ دا موضوعنا اليوم "علم البيانات" او Data Science 🔥. ضيفتنا اليوم دكتوره. أمل بخاري وكيل عمادة البحث العلمي للابتكار وريادة الأعمال - جامعة جدة وخبيرة في مجال علم البيانات، حا نتكلم عن كيف تدخل في المجال من البداية، ونشوف الفر ...Show more
DigiClub Bits : Comment on peut devenir Data Scientist ? (Ep114)
Dans cet extrait de l'épisode 114 de DigiClub powered by Topnet, nous avons posé la question à Marwen Dhemayed, instructeur en Data Science : c'est quoi un Data Scientist, ce métier en pleine croissance dans le monde ? Producteur : Walid Naffati Ingénieur son : Ghazi Neffati Pro ...Show more