مسائل ریاضی در مهندسی

  • 2021-09-14

تصمیم گیری با معیارهای چندگانه فازی مبتنی بر داده و کاربردهای بالقوه آن 2022

پیش بینی بازار سهام بر اساس متن اخبار مالی استخراج و شناخت احساسات سرمایه گذار

چکیده

بازار سهام معمولاً به عنوان معمای اقتصاد در نظر گرفته می شود که می تواند عملکرد اقتصادی یک کشور یا منطقه را منعکس کند. بازار سهام به عنوان بخش مهمی از بازار مالی، نقش مهمی در بخش مالی ایفا می کند. چه در حوزه دانشگاهی و چه در زمینه سرمایه گذاری، پیش بینی های بازار سهام همیشه علاقه زیادی را برانگیخته است. اخبار مالی منبع مهمی از اطلاعات در بازار مالی است که منعکس کننده نوسانات خلقی سرمایه گذاران است و اغلب با روند بازار همراه است. با این حال، به دلیل ویژگی‌های غیرساختاری و حرفه‌ای اخبار مالی، چالش‌هایی در تعیین کمیت دقیق تمایلات عاطفی آنها وجود دارد. این تحقیق بر اساس مدل مارکوف پنهان (HMM) برای تقسیم بندی متن اخبار مالی انجام شده است. تشخیص و طبقه‌بندی احساسات خبری توسط الگوریتم حافظه کوتاه‌مدت دوسویه (BI-LSTM) انجام می‌شود و مدل حافظه کوتاه‌مدت بلندمدت (LSTM) با شاخص احساسات متنی و داده‌های معاملات بازار سهام برای تحقق پیش‌بینی آموزش داده می‌شود. بازار سهامنتایج نشان می دهد که الگوریتم BI-LSTM بهتر از الگوریتم فرهنگ لغت عاطفی در تشخیص عاطفی عمل می کند. و شاخص احساسی متن اخبار مالی می تواند دقت پیش بینی بازار سهام را تا حدی افزایش دهد. در مقایسه با استفاده از شاخص فنی بازار سهام و فقط بردار متن اخبار، دقت پیش‌بینی را می‌توان تا حدود 2 درصد بهبود بخشید.

1. مقدمه

بازار سهام اغلب به عنوان فشارسنج منعکس کننده وضعیت اقتصاد ملی در نظر گرفته می شود. نوسان قیمت سهام می تواند تا حدودی منعکس کننده عملکرد سرمایه و دیدگاه بازار صنایع یا شرکت ها در یک کشور یا منطقه باشد. بازار سهام مرجع قابل توجهی برای تحلیل و پیش بینی اقتصاد است [1، 2]. با بهبود زیرساخت اینترنت و نفوذ مداوم خدمات اینترنت، تعداد کاربران اینترنت در چین رشد ثابتی را حفظ کرده است. آکادمیک و بازار ثانویه هر دو مملو از علاقه زیادی به پیش بینی بازار سهام هستند. در طول سال‌ها، دانشگاهیان مالی در حال بررسی عملکرد درونی بازار سهام و تلاش برای پیش‌بینی نوسانات آن بوده‌اند. قیمت سهام دارای ویژگی متمایز نوسانات تصادفی بالا است. بنابراین، پیش‌بینی قیمت سهام تقاضایی است و از دقت پیش‌بینی ضعیفی برخوردار است [3، 4]. قیمت سهام گذشته معمولاً برای پیش بینی قیمت آتی مورد استفاده قرار می گیرد [5، 6]. با این حال، برخی از محققان بر این باورند که اطلاعات قیمت گذشته در بازار کارآمد در پیش‌بینی قیمت آینده بی‌فایده است [7، 8]. فرضیه بازار کارا معتقد است که در بازار سهام با قوانین صحیح، عملکرد خوب، شفافیت بالا و رقابت کامل، تمام اطلاعات ارزشمند به موقع، دقیق و به طور کامل در روند قیمت سهام منعکس شده است که شامل ارزش فعلی و آتی بنگاه‌ها می‌شود.. سرمایه‌گذاران نمی‌توانند با تجزیه و تحلیل قیمت‌های گذشته، سود اضافی بالاتر از میانگین بازار به دست آورند، مگر اینکه دستکاری در بازار وجود داشته باشد. در مقابل، نوسان قیمت سهام یک مشکل طبقه بندی شناخته شده است. پیش بینی نوسانات قیمت سهام امکان پذیرتر و عملی تر از پیش بینی دقیق قیمت است.

بازار سهام چین تعداد زیادی از سرمایه گذاران را دارد که از این تعداد سرمایه گذار خرده فروشی نسبت نسبتاً بالایی حساب می کند. براساس آمار سه ماهه چهارم سال 2021 ، از بین کل ارزش بازار بورس اوراق بهادار چین ، سرمایه گذاران نهادی حدود 20. 3 ٪ از کل سهام را به خود اختصاص داده اند و سرمایه گذاران انفرادی 22. 6 ٪ را به خود اختصاص داده اند. سرمایه گذاران خرده فروشی یک چرخه سرمایه گذاری کوتاه دارند و مستعد ابتلا به احساسات سنگین غیر منطقی هستند. تا حدی ، آنها فاقد دانش مالی حرفه ای و توانایی مقاومت در برابر خطرات مورد نیاز برای سرمایه گذاری هستند. آنها نسبت به تغییرات سیاست کوتاه مدت نسبتاً بیشتر نگران هستند و ذهنیت آنها به اندازه کافی بالغ نیست. سرمایه گذاران خرده فروشی در برابر اخبار مختلف آسیب پذیر هستند و مستعد تعقیب عاطفی بالا و پایین و کورکورانه در پی روند هستند. بازار سهام محدودیت های مختلفی از تجارت در چین دارد و اخبار بازار و سیاست های ملی تأثیر زیادی در بازار سهام دارد و در نتیجه باعث افزایش احتمال تجارت غیر منطقی می شود [9 ، 10]. بنابراین ، ویژگی های ساختاری سرمایه گذاران با بخش زیادی از سرمایه گذاران خرده فروشی ، محدودیت های مکانیسم معاملاتی سخت و تأثیر سیاست های بزرگ ، بازار سهام چین را در برابر معاملات غیر منطقی عاطفی آسیب پذیرتر می کند و ویژگی های نوسانات مکرر بازار را نشان می دهد.

در عصر داده های بزرگ، تعداد زیادی اطلاعات و داده های متنوع با سرعت بالا تولید می شوند. زندگی مردم به طور فزاینده ای به اینترنت وابسته است و ارتباطات و بحث بین سرمایه گذاران نیز از آفلاین به آنلاین تغییر کرده است. سرمایه‌گذاران بیشتر و بیشتری از طریق اپلیکیشن‌های موبایل و صفحات وب مالی، انواع اطلاعات در مورد بازار سهام، صنایع ملی و شرکت‌ها را دریافت می‌کنند و به تبادل نظر می‌پردازند و دیدگاه‌های سرمایه‌گذاری خود را در این پلتفرم‌ها بیان می‌کنند [11، 12]. اینترنت به تدریج تبدیل به یک رسانه مبادله اطلاعات ضروری برای سرمایه گذاران فردی برای بحث و تبادل نظر در مورد بازار سهام شده است، به ویژه برای نسل جدید جوانانی که به اینترنت عادت کرده اند. سرمایه گذاران انفرادی توسط انرژی و توانایی کسب اطلاعات خود محدود می شوند و بیشتر در معرض تأثیر اطلاعات رسانه های آنلاین هستند که منجر به برخی رفتارهای سرمایه گذاری غیرمنطقی می شود. در عین حال اطلاعاتی را نیز منتشر می کنند و نظرات خود را بیان می کنند [13، 14]. بنابراین، انجمن سهام و دیگر پلتفرم‌های آنلاین نقش مهمی را در تأثیرگذاری بر تصمیمات سرمایه‌گذاری سرمایه‌گذاران فردی ایفا می‌کنند. سرمایه گذاران می توانند اطلاعات به موقع را از طریق وب سایت مالی در اینترنت به دست آورند، که می تواند منابعی را برای تصمیمات سرمایه گذاری خود در اختیار سرمایه گذاران قرار دهد. هر زمان که اخبار مالی در سطح یک کشور، صنعت یا شرکت منتشر شود، تأثیر گسترده ای در اینترنت ایجاد می کند. مهم نیست که اخبار مثبت یا منفی باشند، این اخبار به طور نامرئی بر سرمایه گذاران تأثیر می گذارد و بیشتر بر تصمیمات سرمایه گذاری بعدی آنها تأثیر می گذارد و در نتیجه تأثیر خاصی بر بازار سهام می گذارد.

در سالهای اخیر ، توسعه فناوری پردازش زبان طبیعی امکان استفاده از مقدار زیادی از اطلاعات نظر نظر سرمایه گذار را فراهم کرده است. این به محققان کمک می کند تا داده های عظیم را به طور کلی درک کنند و اطلاعات کلیدی مورد نیاز خود را استخراج کنند. فناوری خزنده می تواند مقدار زیادی از اطلاعات را از اینترنت خزنده و آن را به طور مؤثر ذخیره کند. فناوری استخراج متن می تواند با استفاده از روش فرهنگ لغت و روش یادگیری ماشین ، عوامل عاطفی را در اطلاعات به طور مؤثر استخراج کند ، تا بتواند پشتیبانی فنی را برای بررسی تأثیر احساسات سرمایه گذار بر بازده سهام فراهم کند. در این مطالعه ، ما از فناوری خزنده استفاده می کنیم تا به سرعت تعداد زیادی از گزارش های خبری مالی را بدست آوریم و از فناوری معدنکاری متن برای تجزیه و تحلیل احساسات متون خبری مالی استفاده کنیم ، به منظور دستیابی به اندازه گیری عاطفی اخبار مالی. در گذشته ، تحقیقات در مورد بازار سهام معمولاً از داده های تاریخی بازار سهام ، مانند حجم معاملات ، نرخ گردش مالی ، قیمت باز و قیمت بسته شدن استفاده می کنند. معمولاً از داده های سری زمانی برای تجزیه و تحلیل رگرسیون در مطالعات قبلی استفاده می شود تا سعی کنید الگوی بازار سهام را پیدا کنید ، در حالی که این مقاله اطلاعات خبری مالی را برای مطالعه انتخاب می کند [15]. متن خبری مالی متعلق به داده های بدون ساختار است که برای استخراج ویژگی ها قبل از تحقیقات بیشتر باید پردازش شود. در مقایسه با روش رگرسیون خطی سنتی ، این مطالعه از الگوریتم BI-LSTM برای طبقه بندی استفاده می کند ، که توانایی تعمیم مدل را بهبود می بخشد.

متفاوت از روش قبلی تجزیه و تحلیل رگرسیون با استفاده از داده های سهام تاریخی ، این مقاله چشم انداز جدیدی را برای تحقیق پیش بینی بازار سهام از منظر تجزیه و تحلیل احساسات متنی و یادگیری ماشین فراهم می کند. این مطالعه با توجه به نیازها به پنج بخش تقسیم می شود. بخش اول اهمیت و پیچیدگی پیش بینی بازار سهام ، تأثیر احساسات سرمایه گذار بر نوسان بازار سهام و روش پیش بینی بازار سهام را بر اساس استخراج متن شرح می دهد. بخش دوم وضعیت تحقیق پیش بینی بازار سهام را بر اساس استخراج احساسات متن اخبار مالی معرفی می کند. در بخش سوم ، متن اخبار مالی با استفاده از روش تقسیم کلمه بر اساس HMM از پیش پردازش می شود ، طبقه بندی احساسات خبری توسط الگوریتم BI-LSTM تحقق می یابد ، و سپس شاخص احساسات خبری محاسبه می شود. سرانجام ، پیش بینی بازار سهام با آموزش مدل LSTM تحقق می یابد. بخش 4 دقت روشهای تشخیص احساسات متن را بر اساس الگوریتم دیکشنری احساسات مالی چین و الگوریتم BI-LSTM مقایسه می کند و تأثیر پیش بینی کننده شاخص احساسات خبری را در بورس سهام تأیید می کند. بخش پنجم اهمیت و ارزش مهم استخراج متن اخبار مالی را برای پیش بینی بازار سهام خلاصه می کند.

2. کار مرتبط

در کنار پیشرفت بازار سهام ، بیشتر و بیشتر سرمایه گذاران کشف می کنند که فرصت های سرمایه گذاری فراوانی در بازار سهام وجود دارد. اخبار مالی اولین اخبار دست اول است که سرمایه گذاران عمومی می توانند دریافت کنند ، سرمایه گذاران بر اساس آنها تصمیمات سرمایه گذاری می گیرند. از این رو ، سرمایه گذاران از اهمیت عملی زیادی برخوردار هستند که بتوانند روشی را برای پیش بینی تأثیر اخبار در بازار سهام پیدا کنند. با پیشرفت فن آوری های مختلف رایانه ای ، تحقیقات در مورد استفاده از الگوریتم یادگیری ماشین و فناوری استخراج متن در زمینه مالی در مقایسه با گذشته به طور قابل توجهی افزایش یافته است. فرت و همکاران. دریافتند که شرکت هایی که شفافیت شرکت کمتری دارند نسبت به شرکت هایی با شفافیت شرکت های بالا در برابر احساسات سرمایه گذار آسیب پذیرتر هستند. این اهمیت شفافیت شرکت ها را در کاهش تأثیر احساسات سرمایه گذار بر قیمت سهام تأیید می کند [16]. لی و همکاران. دریافت که وقتی از شاخص Sentiment BW استفاده می شود ، رابطه علّی بین احساسات و بازده سهام فقط در مقدار کمتری وجود دارد. هنگامی که از شاخص اعتماد به نفس مصرف کننده به عنوان یک پروکسی استفاده می شود ، رابطه علّی بین بازده سهام و احساسات قابل توجه می شود [17]. Klemola و همکاران. از حجم جستجوی Google برای اندازه گیری توجه بازار به عنوان اطلاعات عاطفی استفاده کرد و دریافت که تغییر در میزان کلمات جستجوی منفی مانند "سقوط بازار" و "بازار خرس" و تغییر در میزان کلمات جستجوی مثبت مانند "بازگشت بازار" می تواند توضیح دهدبازده کوتاه مدت سهام [18]. دوان و همکاران. دریافت که افزایش توجه باعث می شود بازگشت بازار سهام برای روز و دو روز آینده کاهش یابد و هرچه اختلاف سرمایه گذار بیشتر شود ، حجم معاملات کوتاه مدت بیشتر می شود [19]. هیلرت و همکاران. از روش فرهنگ لغت عاطفی برای ساخت شاخص های عاطفی روزانه استفاده کرده و از انحراف استاندارد این شاخص های عاطفی به عنوان متغیر پروکسی تفاوتهای نظر استفاده می کند. مشخص شد که اختلاف نظر با نرخ بازده روز بعد منفی است و توانایی پیش بینی خاصی دارد [20]. هو و وانگ با کمیت نمره عاطفی اخبار این خبر را طبقه بندی کردند و یک مدل شبکه عصبی مصنوعی را برای پیش بینی نوسانات قیمت سهام با نمره عاطفی اخبار ساختند. نتایج تجربی ثابت می کند که مدل پیش بینی با استفاده از نمره عاطفی اخبار بهتر از مدل پیاده روی تصادفی است [21]. گونتر و اورلین رابطه بین محیط زیست را مورد مطالعه قرار دادند ،

اخبار اجتماعی و حاکمیت و بازار سهام. از منظر احساسات خبری ، این اخبار به اخبار مثبت و اخبار منفی تقسیم می شوند. نتیجه گیری تحقیق نشان می دهد که وقتی شرکت ها با اخبار منفی روبرو هستند ، قیمت سهام به طور متوسط 0. 1 ٪ کاهش می یابد. هنگامی که شرکت ها با اخبار مثبت روبرو هستند ، قیمت سهام تغییر نمی کند [22]. رحمان و همکاران. مدلی را ساخته اید که می تواند قیمت سهام را بر اساس الگوریتم یادگیری ماشین و داده های اخبار مالی پیش بینی کند. این مدل می تواند احساسات اخبار مالی را به رسمیت بشناسد و مدل به نتایج پیش بینی خوبی رسیده است [23]. مو و همکاران. ده ها میلیون مقاله خبری را مورد تجزیه و تحلیل قرار داد و با محاسبه نمره عاطفی ، تأثیر بازخورد بین احساسات خبری و بازده بازار سهام را مورد مطالعه قرار داد. نتیجه گیری تحقیق نشان می دهد که احساسات خبری تأثیر منفی بر بازده دارد که بورس سهام به مدت 5 روز عقب می افتد و بازده بازار تأثیر مثبتی بر احساسات خبری دارد وقتی که بازار سهام به مدت 1 روز عقب می ماند [24]. وو و همکاران. ساخت عامیانه کلمه عاطفی کلمه عامیانه ، توییتر و پیام های پیام کوتاه بر اساس روش فرهنگ لغت ، با دقت 84 ٪ به پنج دسته تقسیم می شوند [25]. مالاندری و همکاران. بهترین استراتژی های تخصیص دارایی ساخته شده توسط مدلهای مختلف یادگیری ماشین را مقایسه کرده و دریافتند که شبکه حافظه کوتاه مدت بلند مدت بهتر از Perceptron چند لایه و جنگل تصادفی است و اضافه کردن داده های عاطفی باعث می شود استراتژی تخصیص دارایی بهتر عمل کند [26]. در ادبیات فوق ، شاخص های عاطفی به صورت یک جانبه در تحقیقات احساسات خبری قرار می گیرند و مقایسه بین روشهای مختلف طبقه بندی عاطفی حاصل نشده است. در این مقاله نشانگر عاطفی جامع تر ایجاد شده و الگوریتم ها را بر اساس شبکه عصبی و فرهنگ لغت عاطفی مقایسه می کند.

3. پیش بینی بازار سهام بر اساس استخراج متن و تشخیص احساسات

3. 1بخش جهانی مبتنی بر مدل مخفی مارکوف

در مقایسه با الگوریتم تقسیم بندی کلمه بر اساس شبکه عصبی ، HMM ویژگی های سرعت محاسبات سریع ، انعطاف پذیری بالا و دقت بالایی را دارد. بنابراین ، این مقاله روش تقسیم کلمه را بر اساس HMM انتخاب می کند. HMM یکی از مدلهای کلاسیک در الگوریتم یادگیری ماشین است که مبتنی بر احتمال و آمار است. فرآیندی که توسط آن یک زنجیره مارکوف پنهان یک توالی حالت غیرقابل کنترل ایجاد می کند توسط HMM شرح داده می شود ، و سپس دنباله ای از مشاهدات از هر حالت ایجاد می شود. HMM به طور گسترده در پردازش زبان طبیعی ، تشخیص گفتار ، تشخیص الگوی و سایر زمینه ها استفاده می شود. در پردازش زبان طبیعی ، HMM را می توان در تقسیم بندی کلمات ، بخشی از برچسب زدن گفتار ، تجزیه و تحلیل نحوی ، شناسایی موجودیت به نام و سایر زمینه ها بر اساس برچسب زدن به کلمه استفاده کرد. در این مقاله ، ما HMM را برای تقسیم کلمه اتخاذ می کنیم.1HMM از لایه پنهان و لایه توالی مشاهده تشکیل شده است همانطور که در شکل 1 نشان داده شده است ، S = S2، s، ... ، S>مگس

در کل مجموعه های حالت M ،در کل مجموعه مشاهده n ، q نشان می دهدحرفمتغیر حالت سیستم را در زمان t نشان می دهد. سپس احتمال انتقال بین حالتهای مختلف می تواند به عنوان یک توصیف شودIJ= P qt 1+= sjدر کل مجموعه مشاهده n ، q نشان می دهدt 1+= s>من= sمنمتغیر حالت سیستم را در زمان t نشان می دهد. سپس احتمال انتقال بین حالتهای مختلف می تواند به عنوان یک توصیف شودIJدر کل مجموعه مشاهده n ، q نشان می دهد =

حرفدر کل مجموعه مشاهده n ، q نشان می دهدt 1+= s>مندر کل مجموعه مشاهده n ، q نشان می دهدحرف1مخفف مشاهده در زمان t است. به طور کلی ، یک HMM را می توان به عنوان λ = [π ، a ، b] ثبت کرد ، جایی که π = π2، π، ... ، S>مگس= sمن= sمن< a متغیر حالت سیستم را در زمان t نشان می دهد. سپس احتمال انتقال بین حالتهای مختلف می تواند به عنوان یک توصیف شود >IJ< b متغیر حالت سیستم را در زمان t نشان می دهد. سپس احتمال انتقال بین حالتهای مختلف می تواند به عنوان یک توصیف شود >IJ

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.