علم آمار و همچنین روزنامهنگاری
علم آمار و همچنین روزنامهنگاری داده (دیتا ژورنالیسم) به روزنامه نگاری کمک می کند تا از هر زمان دقیقتر عمل کند.
پیشتر روزنامهنگاران درباره هر چه دوست داشتند مینوشتند و از هر چه احساس میکردند مهم است حرف میزدند. اما امروز دانشمندان، طراحان، برنامهنویسان و روزنامهنگاران مثل یک تیم کنار هم کار میکنند تا از این دادهها بهترین نتیجه را استخراج کنند، که مسلما منبع ارزشمند و نیروی حیاتی برای تغییر است.
به همین دلیل تصمیم گرفتیم تا شما را با یک واژهنامه دیگر آشنا کنیم تا بتوانید کلمات ابتدایی علم داده را بیشتر بشناسید.
۱. استخراج داده: وقتی از استخراج داده حرف میزنیم، در واقع صحبت از گرفتن دادهها از فاصلهاییست که در اصل برای تعامل انسانها و ترجمه آنها به فرمتی قابل خوانده شدن توسط ماشین طراحی شدهاند.
۲. تمیزکاری داده: عبارتند از تلاش برای بهبود کیفیت کلی دادهها با حذف یا اصلاح دادههای نادرست، ناقص یا غیر مرتبط از یک سیستم داده.
۳. مصورسازی داده: این یک اصطلاحی عمومی است که هر تلاشی برای کمک به مردم در درک اهمیت دادهها با قرار دادن آن در یک زمینه بصری را توصیف میکند. همچنین الگوها، روندها و همبستگیهایی که ممکن است در دادههای مبتنی بر متن ناشناخته بماند، میتواند با مصورسازی دادهها سادهتر شود.
۴. تجزیه و تحلیل دادهها: فرآیند بررسی مجموعه دادهها به منظور به دست آوردن نتیجهگیری در مورد اطلاعات آنها را، به طور فزاینده با کمک سیستمهای تخصصی و نرم افزار.
۵. ابرداده: ابرداده دادههای مربوط به دادههاست. ابرداده نشان دهنده اطلاعات پشت صحنهست که در همه جا، توسط هر صنعت، به روش های مختلف استفاده میشود. ابرداده را می توان در سیستمهای اطلاعاتی، رسانههای اجتماعی، وبسایتها، نرمافزار، تصاویر، خدمات موسیقی، خرده فروشی آنلاین و غیره پیدا کرد.
۶. دانشمند علم داده: کارشناسیست در استخراج بینش و ارزش دادهها. این نقش شامل استفاده از مهارتها در تجزیه و تحلیل، دانش کامپیوتر، ریاضیات، آمار، خلاقیت، تجسم دادهها و ارتباطات و همچنین کسب و کار و استراتژی است.
۷. همبستگی: یک اندازه گیری آماری است که نشان میدهد میزان دو یا چند متغیر در کنار یکدیگر متفاوت است. گاهی اوقات سردرگمی در ارتباط با علیت وجود دارد. به یاد داشته باشید، فقط به این دلیل که دو چیز همبستگی دارند به این معنا نیست که یکی علت دیگریست.
۸. دادهی بزرگ: از این داده به عنوان یک اصطلاح برای توصیف مجموعهای از مجموعه دادههای بسیار بزرگ و پیچیده استفاده میشود که پردازش آن با استفاده از ابزارهای مدیریت پایگاه داده یا برنامههای پردازش دادههای سنتی صورت میگیرد.
۹. داده کاوی: عمل خودکار جستجو در انبار بزرگ دادهها برای کشف الگوها و روندی که فراتر از تجزیه و تحلیل ساده است را داده کاوی مینامند. در این روش از الگوریتمهای ریاضی پیشرفته برای تجزیه و تحلیل دادهها و احتمال وقوع رویدادهای آینده استفاده میشود.
۱۰. عادی سازی: عادیسازی دادهها شامل حذف واحد اندازهگیری آنهاست و این کار به شما اجازه می دهد تا راحتتر دادهها را از مکانهای مختلف با هم مقایسه کنید.