aysannazarmohamady / datajournalism

برای همۀ علاقه‌مندان به نوشتن، روزنامه‌نگاری، علم داده و علوم کامپیوتر

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

"The Story That Data Tells" by Aysan Nazarmohammadi

«برای همۀ علاقه‌مندان به نوشتن، روزنامه‌نگاری، علم داده و علوم کامپیوتر»

مقدمه

برای من البته سفر هیجان‌انگیز آشنایی با روزنامه‌نگاری داده خیلی اتفاقی شروع شد؛ از چند سال قبل به داده‌کاوی علاقه‌مند شدم، نه‌چندان اتفاقی خبرنگار شدم و درحالیکه تلاش می‌کردم به‌نحوی این دو فضای به‌ظاهر بی‌ربط را به هم وصل کنم، با راهنمایی دوستانم در «پیوست» دریافتم که حوزه‌ای با عنوان «روزنامه‌نگاری داده» وجود دارد!
اما به هر حال، قوانین احتمال هم گویای این هستند که برای کم‌تر کسی ممکن است این سلسله اتفاقات غیراتفاقی رخ دهد و به همین دلیل تصمیم گرفته‌ام این داکیومنت درخصوص آشنایی با روزنامه‌نگاری داده یا دیتاژورنالیسم را برای کسانی بنویسم که ممکن است مثل گذشتۀ من هنوز نمی‌دانند چطور فضاهای بی‌ربط ذهن‌شان را به هم ربط دهند، یا دربارۀ روزنامه‌نگاری داده شنیده‌اند و علاقه‌مندند بیشتر بدانند یا به هر دلیل دیگری علاقه‌مندند بدانند دیتاژورنالیسم چیست، از کجا آمده، چه کسانی از آن استفاده می‌کنند، چطور از آن استفاده می‌شود، و...

image

تاریخچه: روزنامه‌نگاری داده چگونه متولد شد؟

[حین نوشتن این داکیومنت برای اولین خوانندگان، این پرسش به وجود اومد که بهتر نبود می‌گفتی اصلاً داری از چی حرف می‌زنی؟ این شد که در ویرایش‌های اولیه، به بخش ابتدایی تاریخچه، تعریف روزنامه‌نگاری داده رو هم اضافه کردم. بنابراین...]

آنچه از آن به‌عنوان «روزنامه‌نگاری داده» یا "Data journalism" یا "data-driven journalism" یا به اختصار "DDJ" یاد می‌شود، حوزه‌ای بین‌رشته‌ای‌ست که در واقع از داده‌های ساختاریافته مثل جدول‌ها یا داده‌های بدون ساختار مثل عکس، فیلم و... به عنوان هستۀ اصلی داستان‌سرایی استفاده می‌کند.

تصور می‌کنم از زمانیکه بشریت نوشتن را آغاز کرد، از داده‌ها هم برای نوشتن استفاده کرده است. اما جمع‌آوری، فیلتر کردن، تمیز کردن و تجزیه و تحلیل داده‌ها در مقیاس بزرگ‌تر در واقع زمانی ممکن شد که اولین کامپیوترها متولد شدند. با این حال، متخصصان حوزۀ روزنامه‌نگاری داده، آغاز این علم (فن) را از سال 1952 در زمان برگزاری انتخابات امریکا و توسط شبکۀ CBS با انگیزۀ پیش‌بینی نتیجۀ این رقابت با کمک کامپیوترها می‌دانند. هرچند گفته می‌شود که آن‌ها هم در واقع اصلاً از داده‌ها در کارشان استفاده نکردند و آغاز روزنامه‌نگاری داده در حقیقت از سال 1967 بوده است؛ زمانیکه روزنامه‌نگاری به نام "Philip Meyer" (مشغول در "Detroit Free Press") از آن برای تحلیل یک نظرسنجی از ساکنان دیترویت استفاده کرد. سرنوشت روزنامه‌نگاری داده بعد از این در سکوت ماند تا اینکه چند دهه بعد، در بریتانیا، گاردین از برخی رویکردهای مشابه روزنامه‌نگاری داده، با اشاره به فعالیت‌های مایر در این زمینه، برای تحلیل و بررسی شورش‌های نژادی استفاده کرد. [1]

image

دنبال کردن روزنامه‌نگاری داده توسط ژورنالیست امریکایی هم در سال 1967 متوقف نشد؛ مایر در دهۀ 1970 با خبرنگارانی از فیلادلفیا در زمینۀ تجزیه و تحلیل الگوهای مجازات در سیستم دادگاه محلی و همچنین در زمینۀ تحلیل و بررسی سوابق ارزیابی دارایی فعالیت‌هایی انجام داد. او کتابی هم با نام «روزنامه‌نگاری دقیق» (Precision Journalism: A Reporter's Introduction to Social Science Methods) نوشت که در آن استفاده از تحلیل پایگاه داده و روش‌های تحقیق اجتماعی را در گزارش توضیح می‌دهد.

image

شاید رفتن به سمت روزنامه‌نگاری داده توسط روزنامۀ بریتانایی را بشود دلیلی بر وضعیت فعلی این علم (فن) دانست؛ چراکه حالا دانشگاه‌‌های کشور انگلستان به شیوه‌های بسیار تخصصی به این حوزه می‌پردازند و استادان انگلیسی نیز از نام‌های پیش‌رو در این حوزه هستند.

[خوشبختانه مواجهه با این افراد پیش‌رو چندان هم سخت نیست. چند ماه از اینکه حوزۀ روزنامه نگاری داده رو شروع کردم، گذشته بود که مکاتبۀ علمی با این افراد رو آغاز کردم. از جمله آقای پاول برادشاو (Paul Bradshaw) استاد دانشگاه بیرمنگام انگلستان و نویسندۀ کتاب «تاریخچۀ روزنامه‌نگاری داده» ("The history of data journalism") که به‌عنوان یک روزنامه‌نگار بریتانیایی در حوزۀ روزنامه‌نگاری داده پیشگام شناخته می‌شه. احتمالاً در بخش‌ دیگه‌ای نقدهایی از او بر برخی گزارش‌هام رو خواهید خواند.]

image

با این حال، فقط تعداد کمی از روزنامه‌نگاران تا اواسط دهۀ 1980 از تکنیک‌های تحلیل داده در روزنامه‌نگاری استفاده کردند تا این که الیوت جاسپین امریکایی با تحلیل داده‌ها در روایت‌های ژورنالیستیش این علم (فن) را بار دیگر به رسمیت شناخت. او بعد از دریافت جایزۀ پولیتزر برای گزارشی به سبک سنتی دربارۀ فساد اتحادیه‌های کارگری، از دانشگاه کلمبیا برای استفاده از داده‌ها در ژورنالیسم بورسیه تحصیلی گرفت. در انتهای دهۀ 1980، حدود 50 روزنامه‌نگار دیگر در سراسر امریکا که اغلب هم با مایر یا جاسپین در این زمینه مباحثه‌ و مشورت داشتند، شروع به استفاده از تجزیه و تحلیل داده‌ها برای گزارش‌های خود کردند. [1]

در این بین نباید از بعضی فعالیت‌های جسته و گریختۀ دیگر در این زمینه غافل شد. برای مثال در سال 1849، "New York Tribune" نموداری در یکی از گزارش‌هاش منتشر کرد که میزان مرگ و میر ناشی از وبا را توضیح می‌داد.

در دهه‌های 70 و 80، زمان کار روی ماشین‌های محاسباتی ارزان‌تر شد و پردازش داده‌ها آسان‌تر و از آن پس تعداد پروژه‌هایی که به عنوان روزنامه‌نگاری داده یا روزنامه‌نگاری داده‌محور شناخته می‌شوند، افزایش پیدا کرد. [2]

اما پیدایش هوش مصنوعی کار را برای روزنامه‌نگاران داده از پیش خیلی آسان‌تر کرده است. آن‌ها حالا دیگر از هوش مصنوعی برای مدیریت داستان‌سرایی، ردیابی منابع داده‌های دریافتی و به روز نگه داشتن داستان‌های منتشرشده در وب استفاده می‌کنند. پروژۀ Arc واشنگتن پست و استودیو Quartz AI هر دو از جمله دستاوردهای اخیر روزنامه‌نگاری داده هستند که این فناوری را به اندازۀ کافی برای همۀ افراد در اتاق خبر آسان کرده‌اند.

روزنامه‌نگاری داده نیازمند چه مهارت‌هایی‌ست؟

اگر تحلیل مواردی که در نگاه اول ممکن است معنادار نباشند، برای شما حوصله‌سربر است، پیشنهاد می‌کنم به طرف روزنامه‌نگاری داده و حتی علم داده نروید! اما اگر این کار برای شما همواره تجربۀ خوشایندی بوده و شاید هم مثل من از کودکی به پیدا کردن الگوهای میان اشیاء موجود علاقه‌مند بوده‌اید، بهتر است برای اینکه بخواهید یک روزنامه‌نگار داده شوید، بر روی مواردی که در ادامه خواهم گفت تمرکز بیشتری کنید. [3]

1.مهارت نوشتن: درست است که داده‌ها بخش مهم روزنامه‌نگاری داده‌ را تشکیل می‌دهند اما مهارت خوب نوشتن هم مهم است. مهارت نوشتن به ویژه حین نوشتن مقالاتی با آمارهای پیچیده می‌تواند بسیار ارزشمند باشد. این مهارت‌ها شامل گرامر، واژگان، داستان‌سرایی و... است. تعاملی که نویسنده می‌تواند با داشتن این مهارت‌ها بین مؤلفه‌های مختلف متن برقرار کند، باعث می‌شود خواننده اطمینان پیدا کند نوشته، روایتی قانع‌کننده است.

2.آشنایی با علم داده و ابزارهای آن: ابزارهای مختلفی برای کار با مفاهیم علم داده وجود دارد. مثلاً اکسل، زبان SQL، زبان برنامه‌نویسی پایتون و غیره. روزنامه‌نگاران داده می‌توانند با استفاده از این دست ابزارها داده‌ها بهتر جمع‌آوری و تحلیل و تفسیر کنند.

3.جمع‌آوری و پردازش داده‌ها: مهارت جمع‌آوری داده‌ها به تهیۀ گزارش‌های خبری کمک بیشتری می‌کند. این روند بازیابی داده‌ها از منابع مختلف و آماده‌سازی آن‌ها برای تجزیه و تحلیل و در عین حال یادداشت اطلاعات ناسازگار یا گم‌شده را در بر می‌گیرد. ایجاد راه‌حل‌هایی برای شناسایی این تناقض‌ها می‌تواند تضمین کند که منبعی جامع و دقیق از شواهد داریم. از طریق تجزیه و تحلیل داده‌ها هم می‌توانیم الگوها را شناسایی کنیم.

[تو حوزه تحلیل داده، اصولاً یا یه سری دیتاست برای استفاده داریم یا اینکه باید خودمون داده‌ها رو جمع‌آوری کنیم و دیتاست بسازیم. مثلاً اگر تو سطح شبکۀ اینترنت به دنبال تحلیل داده‌هایی هستیم که تو قالب یه دیتاست قابل استفاده وجود ندارن، می‌تونیم به سراغ از تکنیک‌های وب اسکرپینگ بریم. تو سازمان‌ها هم معمولاً پایگاه داده‌های رابطه‌ای وجود داره که با استفاده از تکنیک‌های SQL و غیره می‌تونیم داده‌هایی که می‌خوایم رو استخراج کنیم.]

علم داده چیست؟

به گمانم وقت آن رسیده، پیش از آن که بیشتر وارد موضوعات مربوط به روزنامه‌نگاری داده شویم، کمی هم از علم داده بگوییم؛ به‌ویژه در زمانه‌ای که به واسطۀ ترند شدن موضوعاتی مثل هوش مصنوعی و یادگیری ماشین، علم داده نیز شهرت زیادی پیدا کرده است. با ترند شدن موضوعات و مشاغل مرتبط با داده، سه عنوان که بیشتر در زبان‌ها می‌چرخد، گاهی با هم اشتباه گرفته می‌شود و برای بسیاری این سوال را به وجود می‌آورد که تفاوت میان آن‌ها چیست؛ مهندسی داده، تحلیل داده و علم داده.

مهندسی داده: مهندسان داده روندهایی (pipeline) را طراحی می‌کنند که داده‌ها به نوعی ذخیره، تبدیل و منتقل شوند تا آماده و کاربردی به دست دانشمندان داده برسند. داده‌ها از منابع مختلفی جمع می‌شوند و در یک انبارداده ذخیره می‌شوند که به عنوان یک منبع داده قابل اتکا مورد استفاده قرار بگیرد.

تحلیل داده: تحلیل‌گران داده تحلیلگران داده، داده‌ها را سازمان‌دهی می‌کنند تا روندهایی را شناسایی کنند که می‌توانند در تصمیم‌گیری مفید باشند. این افراد از دانش فنی و حوزۀ خود برای ارائۀ توصیه‌هایی استفاده می‌کنند که می‌تواند به رشد کسب‌وکار کمک کند.

علم داده: دانشمندان داده اغلب با تحلیلگران داده اشتباه گرفته می‌شوند؛ به‌این دلیل که هم‌پوشانی زیادی در مجموعۀ مهارت‌های آنان وجود دارد. با این‌ حال، تفاوت اصلی میان این دو آن است که دانشمندان داده مدل‌های یادگیری ماشین (Machine Learning) را می‌سازند، درحالی‌که تحلیلگران داده این کار را نمی‌کنند. دانشمند داده باید مهارت‌هایی داشته باشد که بسیار به تحلیلگر شبیه است. آنان باید بدانند چگونه داده‌ها را جمع‌آوری کنند و تغییر دهند، آن‌ها را نمایش دهند، روی‌شان تحلیل‌های مختلف انجام دهند و مشکلات تجاری را با کمک داده‌ها حل کنند.

در کنار تمامی مهارت‌های ذکرشده، هم‌چنین دانشمندان داده باید بدانند چگونه مدل‌های پیش‌بینی ایجاد کنند.

...

منابع:

  1. datajournalism.com/read/longreads/the-history-of-data-journalism
  2. pinardag-1.gitbook.io/datajournalism/3.what-is-data-journalism-origins-of-data-journalism
  3. ca.indeed.com/career-advice/career-development/data-journalist

About

برای همۀ علاقه‌مندان به نوشتن، روزنامه‌نگاری، علم داده و علوم کامپیوتر