مقدمه در دنیای به سرعت در حال تغییر پردازش و تجزیه و تحلیل کلان داده ها، مدیریت بالقوه مجموعه داده های گسترده به عنوان یک ستون اساسی برای شرکت ها عمل می کند.
ویژگیهای جدید در AWS SageMaker Data Wrangler آمادهسازی دادهها را برای عملکرد بهینه افزایش میدهد آمادهسازی دادهها گامی مهم در هر پروژه یادگیری ماشینی است. آی تی...
Amazon Redshift یک سرویس انبار داده کاملاً مدیریت شده در مقیاس پتابایت در فضای ابری است. Amazon Redshift شما را قادر می سازد تا تجزیه و تحلیل پیچیده SQL را در مقیاس ...
این پست با همکاری بیونگجون چوی و سانگا یانگ از SikSin نوشته شده است. SikSin یک پلت فرم فناوری است که مشتریان را با شرکای رستورانی که به آنها خدمات ارائه می دهند، متصل می کند.
در چند سال گذشته شاهد یک تغییر پارادایم فوق العاده در نحوه منبع یابی و ادغام منابع داده های متعدد توسط مدیران دارایی های سازمانی در سرمایه گذاری خود بوده ایم.
AWS Glue DataBrew بیش از 350 تبدیل از پیش ساخته شده را برای خودکارسازی وظایف آماده سازی داده ها (مانند فیلتر کردن ناهنجاری ها، استانداردسازی فرمت ها و اصلاح مقادیر نامعتبر) ارائه می دهد که...
کسبوکارها هر روز دادههای بیشتری را جمعآوری میکنند تا فرآیندهایی مانند تصمیمگیری، گزارشدهی و یادگیری ماشین (ML) را هدایت کنند. قبل از تمیز کردن و تبدیل داده های خود، باید تعیین کنید که آیا برای استفاده مناسب هستند یا خیر. دادههای نادرست، از دست رفته یا بدشکل میتوانند تأثیرات زیادی بر تجزیه و تحلیل پایین دستی و فرآیندهای ML داشته باشند. انجام بررسی کیفیت داده ها به شناسایی مشکلات کمک می کند […]
قبل از اینکه بتوانید تصاویر و داشبوردهایی ایجاد کنید که اطلاعات مفیدی را منتقل می کنند، باید داده های اساسی را تغییر داده و آماده کنید. با AWS Glue DataBrew، اکنون می توانید به راحتی مجموعه داده ها را از سرویس ذخیره سازی ساده آمازون (Amazon S3)، یک انبار داده Amazon Redshift، Amazon Aurora و دیگر پایگاه های داده سرویس پایگاه داده رابطه ای آمازون (Amazon RDS) تبدیل و آماده کنید.
تجزیه و تحلیل داده ها همچنان یک موضوع داغ است. کسبوکارهای بیشتری شروع به درک پتانسیل دادههایشان میکنند تا بتوانند به طور مؤثرتری به مشتریان خدمت کنند و به آنها مزیت رقابتی بدهند. با این حال، برای بسیاری از مشاغل کوچک و متوسط، به دست آوردن بینش از داده های آنها می تواند چالش برانگیز باشد زیرا آنها اغلب فاقد داده های داخلی […]