وقتی تحلیل داده‌های انبوه به کمک سیاستگذاران می‌آید

نتایج پژوهش دانشیار دانشگاه تهران درباره یادگیری بازنمایی گراف توسط الزویر منتشر شد | پیش‌بینی الگوی رفتاری کاربران با پردازش کلان داده‌ها

تعداد بازدید:۱۵۷۴
نتیجه تحقیقات دکتر هادی زارع عضو هیأت علمی دانشگاه تهران که در آزمایشگاه کاوش و شناخت اطلاعات دانشکده علوم و فنون نوین دانشگاه تهران انجام شده است، در نشریه Neurocomputing انتشارات الزویر منتشر شد.
نتایج پژوهش دانشیار دانشگاه تهران درباره یادگیری بازنمایی گراف توسط الزویر منتشر شد | پیش‌بینی الگوی رفتاری کاربران با پردازش کلان داده‌ها

به گزارش روابط عمومی دانشگاه تهران، دکتر هادی زارع، دانشیار دانشکده علوم و فنون نوین دانشگاه تهران، درباره ماهیت و روند این پژوهش گفت: «در دنیای امروز با رشد روزافزون شبکه‌های اجتماعی و استفاده از فروشگاه‌های اینترنتی با حجم عظیمی از داده‌ها روبرو هستیم که کاوش و استخراج الگوهای مفید از آنها می‌تواند منجر به تولید محصولات مبتنی بر داده شود که دارای اهمیت زیادی در حوزه‌های مالی، پزشکی و حمل و نقل است. به صورت دقیق‌تر می‌توان بیان کرد که اینگونه داده‌ها در قالب ساختارهای گرافی، امروزه به ساختار‌داده‌ای فراگیر و یک زبان جهانی برای توصیف سیستم‌هایی همچون شبکه‌های حمل‌ونقل شهری، شبکه‌های پروتئینی و شبکه‌های اجتماعی تبدیل شده‌اند.»
این پژوهشگر حوزه علوم داده افزود: «چالش اساسی در استفاده از الگوریتم‌های یادگیری ماشین روی این ساختارداده‌ها، یافتن راهی برای استفاده از اطلاعات ساختاری گراف در کنار اطلاعات مربوط به ویژگی‌ها است. به عنوان مثال از یک طرف با شبکه‌ای از کاربران روبرو هستیم و از طرف دیگر اطلاعات مربوط به پروفایل کاربران نیز می‌تواند بسیار ارزشمند باشد که در نظر گرفتن توأمان آنها در الگوریتم‌های حوزه علوم داده از اهمیت فراوانی برخوردار است؛ چراکه بر اساس آنها می‌توان به پیش‌بینی الگوی رفتاری کاربران و بهره‌گیری از آن در کاربردهای مختلف پرداخت.»
وی ادامه داد: «در سال‌های اخیر روش‌هایی که به صورت خودکار، ساختار گراف را به بازنمایی‌هایی با ابعاد پایین‌تر نگاشت می‌کنند، بسیار مورد توجه قرار گرفته‌اند. به این دسته از روش‌ها یادگیری بازنمایی گراف می‌گویند. با ظهور و موفقیت روزافزون الگوریتم‌های یادگیری عمیق، کاربرد و تعمیم این الگوریتم‌ها در روش‌های یادگیری بازنمایی بسیار مورد توجه قرار گرفته است. به طوری که بسیاری از روش‌های یادگیری بازنمایی بر پایه ساختار تعمیم‌یافته الگوریتم‌های یادگیری عمیق، با نام شبکه‌های عصبی گرافی، بنا نهاده شده‌اند و محور پژوهش‌های قبلی در آزمایشگاه کاوش و شناخت اطلاعات بوده‌اند.»
یافته‌های پژوهش‌های انجام‌شده در این آزمایشگاه، پیش‌تر در قالب دو مقاله با همکاری پژوهشگرانی از دانشگاه RMIT و موناش استرالیا توسط مؤسسه مهندسان برق و الکترونیک و انتشارات الزویر منتشر شده است:


Learning Graph Representations With Maximal Cliques:
Deep node clustering based on mutual information maximization:
 

دانشیار دانشگاه تهران، در توضیح تازه‌ترین نتایج این پژوهش گفت: «در مقاله‌ای که به تازگی به صورت آنلاین در دسترس قرار گرفته و در شماره ماه فوریه سال ۲۰۲۳ نشریه Neurocomputing خواهد آمد، از ترکیب شبکه‌های عصبی گرافی با مدل‌های مولد عمیق استفاده شده است. در این پژوهش، مدل‌های مولد به دنبال یادگیری و تخمین توزیع اصلی داده‌های ورودی هستند تا از این طریق بتوانند عدم قطعیت را در بازنمایی‌ها مدل کنند و همچنین توانایی تولید نمونه‌های جدید را داشته باشند. به این منظور به جای فرض ساده‌کننده و محدودکننده توزیع گاوسی برای داده‌های ورودی، به دنبال مدل‌سازی دقیق‌تر پیچیدگی‌های موجود در داده‌های ورودی هستیم.»
دکتر زارع خاطرنشان کرد: «در دنیای واقعی پژوهشگران معمولاً با داده‌های پیچیده‌ای مواجه می‌شوند که دارای یک ماهیت چندمدی می‌باشند و مدل‌سازی با در نظر گرفتن این فرض می‌تواند به ما در درک عمیق‌تر داده‌ها کمک کند. در این پژوهش بر اساس یک فرضیه طبیعی و با در نظر گرفتن حالات مختلفی که داده‌ها توسط آنها تولید شده‌اند و بهره‌گیری از مدل‌های آمیخته گاوسی برای اولین بار موفق به استفاده از این فرض در ساختارهای شبکه عصبی گرافی شده‌ایم که نتایج قابل ملاحظه‌ای داشته است.»
این مقاله بخشی از رساله دکتری غزاله نیکنام است که به راهنمایی دکتر هادی زارع و با همکاری اساتیدی از دانشگاه‌های اکسفورد انگلستان و گریفیث استرالیا تألیف شده است و از طریق پیوند زیر دست‌یافتنی است:


Graph Representation Learning based on Deep Generative Gaussian Mixture Models:
 

دانشیار دانشکده علوم و فنون دانشگاه تهران، مسیر آینده این پژوهش‌ها را این‌گونه توصیف کرد: «این تحقیق در گام‌های آینده، با لحاظ کردن پویایی داده‌ها و به‌کارگیری آن‌ها می‌تواند نقش مهمی در مدل‌سازی شبکه‌های حمل و نقل و پردازش کلان داده‌های سامانه‌های پزشکی داشته باشد. در این مسیر نیز نتایج اولیه بسیار خوبی حاصل شده است. حمایت از این قبیل پژوهش‌ها، می‌تواند زمینه‌ای برای تحلیل دادگان انبوه کشور در سطح کلان فراهم کند که این به سیاستگذاران و برنامه‌ریزان کمک شایان توجهی می‌کند.»

کلیدواژه‌ها: دانشکده علوم و فنون نوین دستاورد تحلیل داده‌های انبوه دانشگاه تهران


( ۱۰ )

نظر شما :