Внесение в базу рса осаго
возможно ли, онлайн-изменения — Рамблер/авто
Человеческий фактор никто не отменял даже в электронной системе хранения информации. Российский союз автостраховщиков (РСА), будучи связующим звеном между страховщиками и владельцами автомобилей, выступает одновременно и в качестве носителя данных о них, располагая требуемой информационной базой.
Но если автовладелец факт получения нового удостоверения водителя скроет от страховой компании, то в информационной базе РСА могут оказаться ошибочные данные. Подробнее об этом процессе читайте далее.
Как внести изменения в базу данных РСА при смене водительского удостоверения
Гражданское автострахование берёт под свою защиту человека, а не транспортное средство. Отсюда следует, что в информационный банк РСА должны вноситься все изменения, которые происходят с автовладельцем, особенно после смены им удостоверения водителя, хотя у его автомобиля никаких метаморфоз не наблюдается.
Знаете ли вы? Как свидетельствует статистика, семейные водители на 10% реже попадают в автомобильной аварии, нежели холостые, а женщины в любом семейном статусе становятся виновницами ДТП на 10% чаще, чем мужчины.
Куда нужно обращаться
После замены документов, дающих право на вождение автомобиля, необходимо направить заявление об этом своим страховщикам, имеющим право доступа к информационному банку РСА. Если страхователи не осуществили действия по необходимой корректировке в информационной базе, нужно адресовать жалобу прямо в РСА. К ней нужно присовокупить копии документов, подававшихся параллельно с заявлением, а также копию самого заявления с зарегистрированным входящим номером.
Имеется также возможность подачи аналогичной жалобы в Центральный банк. Если и эти жалобы останутся без удовлетворения и без указания причин этого, тогда имеется возможность адресовать свои претензии в суд. Для этого придётся заново подготовить требующиеся документы. Кто вносит новые права в базу РСА Полномочиями обновления сведений в связи с заменой водительских прав располагают исключительно страховые компании. РСА и ЦБ имеют лишь возможность воздействовать на них при наличии соответствующих жалоб на их ошибки.Знаете ли вы? Впервые автомобильную страховку выписали ещё в позапрошлом веке — в 1898 г. Тогда американский автомобилист застраховал своё авто от столкновения с транспортом на конной тяге.
Список необходимых документов
Заявление страховщикам в связи с заменой ВУ об обновлении данных в информационном банке РСА сопровождается:
действующим страховочным договором;паспортной копией;удостоверением водителя;копией или оригиналом прежних страховых договоров.
Как внести изменения в базу данных РСА после замены прав
Каждый из страховщиков располагает своей формой написания заявлений. Однако автовладельцы вольны составлять прошения и произвольно. Закон предписывает изучение заявлений, длящееся не дольше 30 суток. На протяжении этого периода страховые менеджеры обязаны изучить все поданные документы. Затем изменённые сведения поступают в банк данных РСА, а КБМ восстанавливается.
Важно! Восстановление КБМ имеет своим следствием возврат средств, переплаченных автовладельцем из-за случившихся искажений в базе данных. Эти деньги переводятся на банковскую карту водителя.
Что нужно для сохранения КБМ Сохранность КБМ после смены свидетельства о вождении гарантирует сообщение об этом страховщикам.
Сервисы для восстановления КБМ в базе РСА онлайн
Сегодня практически все фирмы, занимающиеся страхованием, располагают в Сети своими сайтами, посредством которых можно общаться со страховыми менеджерами онлайн. Имеется официально зарегистрированный сайт и у РСА, на котором автовладелец имеет возможность получить стандартный образец заявления на реабилитацию прежнего коэффициента. После заполнения этого заявления оно отсылается на электронную почту, где и рассматривается.
Онлайн-сервисы страховых компаний
Как уже говорилось, большинство страховщиков располагают собственными сайтами со специализированными онлайн-сервисами. Посредством их после заполнения требуемых образцов имеется возможность в онлайн-режиме решить вопрос возвращения КБМ.
Как внести данные в базу РСА самостоятельно
Уже подчёркивалось, что полномочиями изменять сведения в базе союза страховщиков располагает исключительно страховая компания. Сам союз страховщиков подобных прав не имеет. Водитель имеет возможность самостоятельно лишь рассчитать величину КБМ. Во всех остальных случаях нужно решать вопрос только со страховщиками.
Узнайте, какие бывают страховки на автомобиль.
Внесение исправлений в КБМ через страховую компанию
В случае, когда автовладелец уверен, что в отношении него в процессе вычисления величины КБМ допущено искажение фактов, ему нужно направить ходатайство своим страховщикам. Это можно осуществить посредством специальных онлайн-сервисов восстановления величины КБМ, исправляющих допущенные огрехи бесплатно.
Как с гарантией сделать восстановление КБМ за несколько дней
Лучше всего это осуществить посредством платных услуг, оказываемых профессиональными юристами.
Куда подавать заявление о восстановлении КБМ через РСА Имеется возможность посредством Интернета отправить ходатайство о восстановлении КБМ на электронную почту РСА: [email protected] Отослать документы можно и с помощью заказного письма по адресу: ул. Люсиновская, 27, кор. 3, Москва, 115093. По этому же адресу имеется возможность лично принести заявление и требуемые документы.
Важно! По статистике, наиболее часто искажённые размеры КБМ возникают вследствие именно замены водительских удостоверений и несвоевременного сообщения об этом событии страховщикам.
Откуда берётся ошибка значения КБМ в базе АИС В качестве коэффициента поправок в процессе составления страховочного договора ОСАГО КБМ предоставляет дисциплинированным автомобилистам, не допустившим ДТП, скидки на покупку договора страхования по 5% ежегодно (но не свыше 50% совокупно). Инициаторы автоаварий, наоборот, наказываются увеличивающими коэффициентами в пределах от 1,4 до 2,45.
Однако при изменившихся данных паспорта, выдаче нового удостоверения водителя или завершении функционирования страховой фирмы информация о скидочных коэффициентах способна быть в банке данных в искажённом виде.
Видео: как восстановить исправить неправильный КБМ в базе РСА Для дисциплинированного водителя, накопившего солидные страховочные бонусы благодаря безаварийной езде, способна стать досадным ударом потеря этих цифр вследствие искажения данных в информационной базе РСА. Но этого легко избежать, если сразу вслед за заменой прав на вождение автомобиля сообщить об этом своим страховщикам.
Как внести изменения в базу данных РСА
Dmitry | 19 Апрель 2016 19:28 |Как внести изменения в базу данных РСА
Итак, водительское удостоверение получено. О предварительных этапах, непосредственно о получении водительского удостоверения возможно прочитать в записях «Замена водительских прав», «Новое водительское удостоверение и медицинская справка».
Но если хотите сохранить коэффициент бонус-малус при получении очередного полиса ОСАГО, необходимо обратиться в страховую компанию после замены водительского удостоверения, чтобы внести в базу данных РСА серию, номер нового водительского удостоверения. В моём случае в базу данных также надо внести данные нового паспорта РФ.
Если не заявить о новых данных до момента, как будете оформлять новый полис ОСАГО, потеряете скидку при оплате полиса. В свете подорожаний полисов в последнее время, думаю, скидка никому не помешает.
Самое первое, поискал информацию на сайте страховой компании. Ничего не нашёл. Придётся ехать в офис страховой.
Так случилось, что появилось время в первой половине рабочего дня. Приехал в офис. Ни одного посетителя. Пришлось поискать кабинет, где возможно получить консультацию по интересующему меня вопросу. Оказалось, что внесением данных в базу данных РСА занимается отдел продаж полисов ОСАГО.
Предоставил менеджеру новый паспорт, водительское удостоверение, копию полиса ОСАГО, так как у меня электронный полис.
Процедура заняла примерно 10 минут. Менеджер распечатала заявление о внесении изменений в базу данных, в котором надо поставить только подпись.
Также мне оформили полис на фирменном бланке. Теперь нет необходимости объяснять сотрудникам ГИБДД, почему я предоставляю копию полиса, а не оригинальный бланк.
Вся процедура совершенно бесплатная.
Перед уходом ещё раз уточнил, сохранится ли у меня КБМ при оформлении электронного полиса на очередной год. На что получил утвердительный ответ.
Но несмотря на утвердительный ответ, решил проверить сам по базе данных в личном кабинете. Проверил. Всё точно. Новые данные паспорта и водительского удостоверения занесены в базу данных.
Ещё записи по теме:
ПОДЕЛИТЕСЬ НАШЕЙ СТАТЬЕЙ С ДРУЗЬЯМИ
Рубрика: Практические советы, Экономика и деньги | Комментариев: 6 »
Как изменить данные в РСА: возможно ли, онлайн-изменения
Человеческий фактор никто не отменял даже в электронной системе хранения информации. Российский союз автостраховщиков (РСА), будучи связующим звеном между страховщиками и владельцами автомобилей, выступает одновременно и в качестве носителя данных о них, располагая требуемой информационной базой. Но если автовладелец факт получения нового удостоверения водителя скроет от страховой компании, то в информационной базе РСА могут оказаться ошибочные данные. Подробнее об этом процессе читайте далее.
Как внести изменения в базу данных РСА при смене водительского удостоверения
Гражданское автострахование берёт под свою защиту человека, а не транспортное средство. Отсюда следует, что в информационный банк РСА должны вноситься все изменения, которые происходят с автовладельцем, особенно после смены им удостоверения водителя, хотя у его автомобиля никаких метаморфоз не наблюдается. Если необходимые поправки в базу не будут внесены, это чревато для автовладельца потерей им скидок, предоставляемых посредством коэффициента бонус-малус (КБМ), и некоторыми другими неприятностями.
Знаете ли вы? Как свидетельствует статистика, семейные водители на 10% реже попадают в автомобильной аварии, нежели холостые, а женщины в любом семейном статусе становятся виновницами ДТП на 10% чаще, чем мужчины.
Куда нужно обращаться
После замены документов, дающих право на вождение автомобиля, необходимо направить заявление об этом своим страховщикам, имеющим право доступа к информационному банку РСА. Если страхователи не осуществили действия по необходимой корректировке в информационной базе, нужно адресовать жалобу прямо в РСА. К ней нужно присовокупить копии документов, подававшихся параллельно с заявлением, а также копию самого заявления с зарегистрированным входящим номером. Имеется также возможность подачи аналогичной жалобы в Центральный банк. Если и эти жалобы останутся без удовлетворения и без указания причин этого, тогда имеется возможность адресовать свои претензии в суд. Для этого придётся заново подготовить требующиеся документы.
Кто вносит новые права в базу РСА
Полномочиями обновления сведений в связи с заменой водительских прав располагают исключительно страховые компании. РСА и ЦБ имеют лишь возможность воздействовать на них при наличии соответствующих жалоб на их ошибки.
Знаете ли вы? Впервые автомобильную страховку выписали ещё в позапрошлом веке — в 1898 г. Тогда американский автомобилист застраховал своё авто от столкновения с транспортом на конной тяге.
Список необходимых документов
Заявление страховщикам в связи с заменой ВУ об обновлении данных в информационном банке РСА сопровождается:
- действующим страховочным договором;
- паспортной копией;
- удостоверением водителя;
- копией или оригиналом прежних страховых договоров.
Как внести изменения в базу данных РСА после замены прав
Каждый из страховщиков располагает своей формой написания заявлений. Однако автовладельцы вольны составлять прошения и произвольно. Закон предписывает изучение заявлений, длящееся не дольше 30 суток. На протяжении этого периода страховые менеджеры обязаны изучить все поданные документы. Затем изменённые сведения поступают в банк данных РСА, а КБМ восстанавливается.
Важно! Восстановление КБМ имеет своим следствием возврат средств, переплаченных автовладельцем из-за случившихся искажений в базе данных. Эти деньги переводятся на банковскую карту водителя.
Что нужно для сохранения КБМ
Сохранность КБМ после смены свидетельства о вождении гарантирует сообщение об этом страховщикам.
Сервисы для восстановления КБМ в базе РСА онлайн
Сегодня практически все фирмы, занимающиеся страхованием, располагают в Сети своими сайтами, посредством которых можно общаться со страховыми менеджерами онлайн. Имеется официально зарегистрированный сайт и у РСА, на котором автовладелец имеет возможность получить стандартный образец заявления на реабилитацию прежнего коэффициента. После заполнения этого заявления оно отсылается на электронную почту, где и рассматривается.
Онлайн-сервисы страховых компаний
Как уже говорилось, большинство страховщиков располагают собственными сайтами со специализированными онлайн-сервисами. Посредством их после заполнения требуемых образцов имеется возможность в онлайн-режиме решить вопрос возвращения КБМ.
Как внести данные в базу РСА самостоятельно
Уже подчёркивалось, что полномочиями изменять сведения в базе союза страховщиков располагает исключительно страховая компания. Сам союз страховщиков подобных прав не имеет. Водитель имеет возможность самостоятельно лишь рассчитать величину КБМ. Во всех остальных случаях нужно решать вопрос только со страховщиками.
Внесение исправлений в КБМ через страховую компанию
В случае, когда автовладелец уверен, что в отношении него в процессе вычисления величины КБМ допущено искажение фактов, ему нужно направить ходатайство своим страховщикам. Это можно осуществить посредством специальных онлайн-сервисов восстановления величины КБМ, исправляющих допущенные огрехи бесплатно.
Как с гарантией сделать восстановление КБМ за несколько дней
Лучше всего это осуществить посредством платных услуг, оказываемых профессиональными юристами.
Куда подавать заявление о восстановлении КБМ через РСА
Имеется возможность посредством Интернета отправить ходатайство о восстановлении КБМ на электронную почту РСА: [email protected] Отослать документы можно и с помощью заказного письма по адресу: ул. Люсиновская, 27, кор. 3, Москва, 115093. По этому же адресу имеется возможность лично принести заявление и требуемые документы.
Важно! По статистике, наиболее часто искажённые размеры КБМ возникают вследствие именно замены водительских удостоверений и несвоевременного сообщения об этом событии страховщикам.
Откуда берётся ошибка значения КБМ в базе АИС
В качестве коэффициента поправок в процессе составления страховочного договора ОСАГО КБМ предоставляет дисциплинированным автомобилистам, не допустившим ДТП, скидки на покупку договора страхования по 5% ежегодно (но не свыше 50% совокупно). Инициаторы автоаварий, наоборот, наказываются увеличивающими коэффициентами в пределах от 1,4 до 2,45.
Однако при изменившихся данных паспорта, выдаче нового удостоверения водителя или завершении функционирования страховой фирмы информация о скидочных коэффициентах способна быть в банке данных в искажённом виде.
Видео: как восстановить исправить неправильный КБМ в базе РСА
Для дисциплинированного водителя, накопившего солидные страховочные бонусы благодаря безаварийной езде, способна стать досадным ударом потеря этих цифр вследствие искажения данных в информационной базе РСА. Но этого легко избежать, если сразу вслед за заменой прав на вождение автомобиля сообщить об этом своим страховщикам.
Подписывайтесь на наши ленты в таких социальных сетях как, Facebook, Вконтакте, Instagram, Pinterest, Yandex Zen, Twitter и Telegram: все самые интересные автомобильные события собранные в одном месте.
База рса осаго — советы адвокатов и юристов
Советы юристов:
1. Можете ли вы внести меня в базу данных РСА, для дальнейшего оформления мною электронного ОСАГО.
1.1. В данном случае вам необходимо обратиться в страховую компанию. Желаю вам удачи в решении вашего вопроса.
Вам помог ответ? Да Нет
2. У меня вопрос, я после приобретения нового автомобиля застраховал по ОСАГО свой автомобиль, на протяжении 11 месяцев я ездил и не думал что полис не числится в базах РСА и в страховой, выяснилось это после того как я приехал продлевать полис ОСАГО в том месте где приобретал автомобиль, получается что я всё это время ездил по не существующему полису, в страховой компании говорят что он действующий хотя он ни где не числится даже у них в базе подскажите куда жаловаться?
2.1. Сергей! В Российский Союз автостраховщиков.
Вам помог ответ? Да Нет
2.2. В рса и пишите жалобу.
Вам помог ответ? Да Нет
3. 15.03.2018 г. я заключил электронный договор ОСАГО с АО «АльфаСтрахование» 15.08.2018 г. я получил уведомление о досрочном прекращении договора руководствуясь п. 1.15 (Правил ОСАГО), т.е. выявление ложных или неполных сведений, предоставленных страхователем при заключении договора. Ни какой конкретики, все требуемые документы при заключении электронного полиса ОСАГО проверялись по базе РСА. Это законно?
3.1. Нет, не законно. Вам необходимо в суде оспорить односторонний отказ от исполнения обязательств со стороны страховой компании.
С Уважением, адвокат в г. Волгограде – Степанов Вадим Игоревич.
Вам помог ответ? Да Нет
3.2. Если сведения предоставлялись достоверные, то не законно. Подавайте в СК заявление с требованием разъяснений. Если не согласны можете обратиться в суд с иском и подать жалобу в РСА.
Вам помог ответ? Да Нет
4. У меня ситуация такая. Продал автомобиль, хотел сдать полис ОСАГО. Выяснилось, что полис «поддельный» — сам бланк оригинальный, в базе РСА числится за Росгосстрахом, но в базе Росгосстраха его нет. Могу ли я вернуть свои деньги?
4.1. упустили самое главное, где вы приобрели данный полис? Если у официального представителя страховой компании или в их офисе, то требуйте письменный отказ и обращайтесь в суд.
Удачи вам и всего наилучшего.
Вам помог ответ? Да Нет
5. Покупаем ТС по договору купли-продажи. Чтобы поставить ТС на учёт в ГИБДД нужна страховка ОСАГО. Электронный полис ОСАГО не можем оформить т.к. в ПТС вписан только прежний собственник. Документ соответственно не проходит проверку в базе РСА. Замкнутый круг какой-то
Вопрос: можно ли в ПТС внести запись о новом собственнике самостоятельно, ручкой?
Не накажут ли за это в ГИБДД?
И поможет ли это получить эл.полис ОСАГО?
5.1. Можно внести самостоятельно, ручкой написав все данные. В графах расписаться.
А, вот по поводу электронного полиса, нет, ведь от записи не появится в базе сведения.
Попробуйте у другого СК получить электронный полис.
Вам помог ответ? Да Нет
6. При расчёте ОСАГО на грузовой автомобиль расчёт был сделан без учёта КБМ =0,5 (результат запроса в базу РСА), в результате страховка вместо 1050 р. обошлась 2105 р.. Подскажите, что делать, что бы произвели перерасчёт?!
6.1. Напишите претензию с требованием сделать перерасчет в страховую компанию, где оформляли полис. В случае отказа обращайтесь в суд.
Вам помог ответ? Да Нет
7. Я купил подержанный автомобиль и хочу его зарегистрировать. Оформил ОСАГО в ООО «Дальакфес», деньги с карты списали, пришло смс с РСА с номером полиса, сроком действия и названием СК. Но на электронную почту так ничего и не пришло. В базе РСА полис пробивается, а на сайте СК пусто в личном кабинете. Вопрос: могу ли я поставить на учет авто без бланка ОСАГО если он есть в базе?
7.1. Если в БАЗЕ РСА полис виден — то вне зависимости от распечатки — ВЫ можете поставить авто на учет
Удачи ВАМ! Всегда рады помочь.
Вам помог ответ? Да Нет
8. пожалуйста если есть полис ОСАГО в СК»Московия» которая на данный момент не осуществляет больше свою деятельность с 20,07,2017, мы поменяли права, каким образом теперь внести новые права в базу данных РСА, что бы не потерять скидку по КБМ?
8.1. Вы ее итак не должны потерять, в данном случае должны быть история в базе, если у Вас не было страхового случая, то информация должна быть отображена, и скидки у Вас будут действовать.
Вам помог ответ? Да Нет
9. Получилась такая ситуация в 2014 году при страховании машины полисом ОСАГО в компании Росгосстрах и страховой агент в базу РСА внёс совершенно не ту дату моего рождения. После чего начались проблемы со страховкой потому что как только я хотел получить полис ОСАГО онлайн проверка в РСА выдавала ошибку в связи с этим мне приходилось страховать машину у агентов где сумма страховки получалась больше. Будет любезный подскажите как поступить и что делать. Заранее благодарен.
9.1. Попробуйте обратиться в РСА с заявлением о приведении сведений о Вас и Ваши страховках в соответствие с фактической информацией. Удачи Вам!
Вам помог ответ? Да Нет
10. Хотел спросить, какая ответственность за продажу полиса ОСАГО (не поддельный, но без внесения в базу РСА)?
10.1. Продажа заведомо подложного документа не Влечет никакой уголовной ответственности, ответственность наступает только тогда, когда этот полис официально пытаются использовать, например предъявляют сотрудникам ГИБДД. Поэтому в данном случае будет ответственность по статье 327 часть 3 УК РФ.
Вам помог ответ? Да Нет
10.2. Если полис не внесен в базу, у водителя могут возникнуть проблемы, в то же время
ст.15 ФЗ «Об ОСАГО»
7.1. Страховщик обеспечивает контроль за использованием бланков страховых полисов обязательного страхования страховыми брокерами и страховыми агентами и несет ответственность за их несанкционированное использование. Для целей настоящего Федерального закона под несанкционированным использованием бланков страховых полисов обязательного страхования понимается возмездная или безвозмездная передача чистого или заполненного бланка страхового полиса владельцу транспортного средства без отражения в установленном порядке факта заключения договора обязательного страхования, а также искажение представляемых страховщику сведений об условиях договора обязательного страхования, отраженных в бланке страхового полиса, переданного страхователю.
страховщик и водитель, которому продали полис может обратиться в полицию с заявлением.
Вам помог ответ? Да Нет
11. Я купила машину по дкп. Могу ли я сделать онлайн ОСАГО, внести данные, что собственник еще старый (иначе база РСА не пропустит полис), сама выступлю страхователем. И с этим полисом поехать в ГИБДД ставить на учет авто?
11.1. В этом случае Ваш полис не будет соответствовать другим документам, так как указан старый собственник. Кстати в течении 10 дней Вы вообще можете ездить без полиса.
Вам помог ответ? Да Нет
12. Выписали не правильно полис ОСАГО (со старыми датами) ДПС вменяют отсутствие полиса и по базе отказались проверять. Выписывают постановление и объясняют, что после того как переделаю полис постановление можно отменить. По факту в ГИБДД отказались отменять постановление и сказали надо в судебном порядке отменять. Подскажите, как быть без вины виноватый. (в базе РСА с датами всё в порядке)
12.1. Вы сами виноваты в случившемся, если в вашем полисе ОСАГО есть ошибки и вы их предварительно не исправили
Желаю Вам удачи и всех благ!
Вам помог ответ? Да Нет
12.2. Вы вправе обжаловать данное постановление в течение 10 суток с момента его вынесения и признать его незаконным Обратитесь с жалобой в суд. Хорошего приятного дня.
Вам помог ответ? Да Нет
13. Оформил онлайн страховку ОСАГО в Росгосстрахе, прикладывал полностью копии документов для проверки в базе РСА. Оплатил, в итоге приходит полис, где указана другая модель автомобиля. В ПТС SUV T11 TIGGO, в страховке Chery T11 TIGGO. Будут ли вопросы при постановке на учет в ГИБДД и что делать, если будут.
Заранее спасибо.
Александр.
13.1. Конечно будут проблемы. Фактически страховка оформлена на другой автомобиль. Обращайтесь в СК и меняйте страховку.
Вам помог ответ? Да Нет
13.2. ГИБДД как правило не особенно присматривается к данным огрехам. Главное чтобы ПТС и остальные данные были в порядке. Поэтому пока не сходите не узнаете.
Вам помог ответ? Да Нет
14. По базе АИС РСА восстановил КБМ, который дает значительную скидку. За какие оформленные ранее полисы ОСАГО я смогу вернуть со страховой компании излишне уплаченную сумму. В страховой сказали, что возможен возврат средств только по действующим полисам! Возможно ли взыскать переплату по ранним полисам ОСАГО через суд в случае отказа СК?
14.1. Пишите заявление. Установленного образца не существует. Пишется в свободной форме с изложением и пояснением обстоятельств по делу. От кого, ваши адрес и телефон, кому (ФИО или название организации, должности), что, где, когда, что просите… Дата, подпись. Но лучше обратиться за составлением к юристу.
Вам помог ответ? Да Нет
15. Как восстановить КБМ в базе РСА при оформлении договора ОСАГО, который обнулили в 2014 или 2015 годах?
15.1. Если страховая компания отказывается менять КБМ, напишите жалобу в РСА либо сразу в Центробанк, через сайт в интернете.
Удачи Вам.
Вам помог ответ? Да Нет
16. При заключения договора электронного полиса ОСАГО пишет, что населенный пункт не соответствует данным базы РСА. Но населенный пункт и регистрация указанна верна, как в паспорте, что делать и как проверить базу данных РСА.
16.1. К сожалению, это распространенная проблема при получении электронного полиса. Вам необходимо позвонить на горячую линию и выяснить как необходимо ввести ваш населенный пункт.
Вам помог ответ? Да Нет
16.2. Анастасия, если при оформлении электронного полиса вам пишет программа, что указанный населенный пункт не соответствует данным базы РСА, попробуйте выбрать из их списка свой населенный пункт. Название населенного пункта в паспорте может не соответствовать названию указанному в базе данных РСА. Желаю удачи!
Вам помог ответ? Да Нет
16.3. Федеральный закон от 2 мая 2006 г. N 59-ФЗ «О порядке рассмотрения обращений граждан Российской Федерации» (с изменениями и дополнениями)
Вы можете запросить причину.
Вам помог ответ? Да Нет
16.4. Анастасия
Вопрос не юридического характера, если база данных не воспринимает ваш населенный пункт.
Только в страховой компании вам подскажут, что необходимо делать в этом случае
Желаю Вам удачи и всех благ!
Вам помог ответ? Да Нет
17. Я уже задавал свой вопрос, но к сожалению мнения разделились и я ничего не понял. Попробую еще раз более подробно.. . оформил электронный полис ОСАГО, через брокера СК, переплаты не было, все согласно расчета, в базе РСА полис значится как — действующий.. . смущает то, что строка СТРАХОВАЯ ПРЕМИЯ не заполнена, т.е. сумма не отражена. Могут ли в дальнейшем быть претензии со стороны ГИБДД, СК. спасибо.
17.1. несущественно если полис действующий в базе РСА тарифы они стандартные
С уважением к Вам, Филатов Евгений Павлович.
Вам помог ответ? Да Нет
17.2. Если в базе РСА полис значится как действующий, никто внимание на отсутствие записей в этой строке внимания не обратит, не переживайте.
Вам помог ответ? Да Нет
18. Могу ли я возвратить излишне уплаченную часть страховой премии по завершенному договору ОСАГО, ТК на время заключения договора в базе РСА содержались ошибочные сведения по КБМ? На сегодняшний день КБМ верный.
18.1. Да, вы можете вернуть излишне уплаченные вами деньги, для этого нужно обратиться с заявлением в страховую компанию. Удачи вам.
Вам помог ответ? Да Нет
19. В полисе ОСАГО не указана сумма страховой премии, это нормально? Полис электронный, в базе РСА числится, а вот на самом полисе не указана сумма…
19.1. В полисе обязательно должны быть заполнены и указаны все реквизиты, в том числе сумма страховой премии. Попросите СК внести все необходимые данные в базу РСА. Успешно решить Ваш вопрос можно с юридической помощью.
Спасибо за то, что воспользовались услугами сайта!
Вам помог ответ? Да Нет
19.2. ЭТО не криминально — ГЛАВНОЕ ЧТО полис действующий и выплаты по нем получить можно
Удачи ВАМ! Всегда рады помочь.
Вам помог ответ? Да Нет
19.3. Нет, конечно ненормально. Но вам достаточно иметь документы свидетельствующие об оплате полиса ОСАГО и наличие полиса в базе РСА.
Вам помог ответ? Да Нет
20. Пытаюсь оформить полис ОСАГО постоянно пишет адрес не соответствует базе РСА.
20.1. Это значит, что страховщик не правильно указал или вы уже имеете другой адрес места регистрации. В этом случае самостоятельно оформить полис не получиться: сначала обратитесь к страховщику с заявлением о снесении изменений в базу данных.
Вам помог ответ? Да Нет
20.2. Андрей! Такое возможно, если ранее вы не были вписаны в страховку. Попробуйте написать им на сайте. Всего доброго!
Вам помог ответ? Да Нет
21. 114.03.17. оформила полис ОСАГО на машину мужа через Альфастрахование онлайн. Полис получила на электронику. Но в базе РСА полис с таким номером не значится. Как быть? Ведь деньги заплачены не малые.
21.1. Значит еще не внесли данные полиса. Напишите жалобу в Альфа банк с просьбой разобраться и провести проверку по данному факту.
Вам помог ответ? Да Нет
22. 13.03.2017. оформила полис ОСАГО на машину мужа через Альфастрахование онлайн. Бланк полиса получила на электронику. Проверяю полис по базе РСА, полис с таким номером не значится. Как быть? Деньги заплачены не малые.
22.1. Заявление в полицию пишите по факту мошенничества
Спасибо, что посетили наш сайт.
Всегда рады помочь! Удачи Вам.
Вам помог ответ? Да Нет
23. Через какое время после оформления полиса ОСАГО, он должен отражаться в базе РСА. Спасибо.
23.1. Через какое время после оформления полиса ОСАГО, он должен отражаться в базе РСА. Спасибо. Здравствуйте. Полис. В базу заносится сразу, при оформлении в автоматическом режиме.
Вам помог ответ? Да Нет
24. Вопрос по ОСАГО. Заканчивается на днях срок полиса ОСАГО. Хочу оформить Е-ОСАГО. Но при этом новый полис хочу оформить на нового собственника (супругу). Сделал договор дарения. Подскажите пожал. Алгоритм моих действий. Дело в том, что на сайте любой страховой не оформят ОСАГО на супругу, т.к. в базе РСА собственником числюсь я. Спасибо.
24.1. Для начала необходимо обратиться в ГИБДД и переоформить авто автотранспортного средства на У вашего мужа после этого он может оформить страховку путем внесения своих данных в базу. Всего хорошего вам.
Вам помог ответ? Да Нет
25. Вопрос по КБМ. Действующий полис ОСАГО у меня с КБМ 1. Ранее (до его заключения) на другом авто было ДТП, я — виновник. Информация о ДТП в базе РСА появилась позже заключения действующего полиса ОСАГО. Подходит время делать новый полис. Теперь, из-за данных о ДТП при расчете КБМ-1,4. Вопрос: КБМ-1 в действующем полисе ОСАГО можно/нет использовать для корректировки моего КБМ в базе РСА. На бланке действующего полиса в доп. отметках есть указание о КБМ-1.
25.1. Вся информация по КБМ содержится в общей базе РСА, если данные о ДТП внесены, то на увеличение данного коэффициента рассчитывать не придется.
Вам помог ответ? Да Нет
26. В какой срок СК должна разместить данные о продаже полиса ОСАГО в базу РСА?
26.1. Сведения о владельце полиса ОСАГО размещаются сразу же после его оформления, так как при оформлении полиса все ваши данные проходят проверку в РСА.
Вам помог ответ? Да Нет
27. В течении какого времени полис ОСАГО вводиться в базу РСА.
27.1. В день страхования, Сергей.
Вам помог ответ? Да Нет
28. При электронном страховании ОСАГО дает ошибку год начала стажа по базе РСА.
28.1. Обратитесь страховую.
Вам помог ответ? Да Нет
29. Как внести данные в базу РСА, для оформления электронного полиса ОСАГО?
29.1. Сотрудники перечисленных организаций могут Вам в этом помочь, т.к. имеют доступ к рабочему пространству и базе на сайте РСА:
Страховые организации – члены РСА, осуществляющие заключение договоров ОСАГО в виде электронных документов:
«АльфаСтрахование» ОАО
«ВСЕ» САО
«Группа Ренессанс Страхование» ООО
«ИНТАЧ СТРАХОВАНИЕ» АО
Либерти Страхование (ОАО)
«РЕСО-Гарантия» СПА
«Росгосстрах» ООО
РСО «ЕВРОИНС» ООО
«САК «ЭНЕРГОГАРАНТ» ОАО
СГ «ТОСКА» ПО
СК «Паритет-СК» ООО
«Страховая группа «УралСиб» АО
«Тинькофф Страхование» АО
АРГО САО.
Вам помог ответ? Да Нет
30. При электронном страховании ОСАГО дает ошибку год начала стажа по базе РСА.
30.1. Владислав, это нормально, т.к. база РСА еще не наполнена даже на треть. Обращайтесь в РСА, на их сайте есть форма обратной связи.
Вам помог ответ? Да Нет
«Проблема с внесением данных полиса ОСАГО в РСА»
Виктор (гость)
Проблема с внесением данных полиса ОСАГО в РСА
До страхового случая, к счастью, дело не дошло.
Так получилось, что на 2013 год оформил осаго в страховой компании Согласие (полис 0627187352), на следующий год обратился в предыдущую страховую компанию. Выяснилось, что за год данные полиса так и не были внесены в базу РСА, в связи с чем оформить полис со скидкой за безубыточное вождение не удается. Конечно можно жаловаться в РСА, но это займет месяц, а времени уже нет. Много раз звонил в Согласие, дважды они приняли мое заявление на внесение в базу, но данные так и не появились. При общении по телефону стойкое ощущение, что от меня хотят отделаться, специалист коллцентра говорит, что ничего не может сделать, кроме как принять мое заявление в третий раз. Другой специалист утверждает, что данные в РСА поступают через неделю после внесения (позвонил в РСА, объяснили что это чушь, данные поступают в реальном времени). Так что, похоже, плакала моя скидка, придется заключать первичный договор. Обходите эту «страховую компанию» стороной.
Качество обслуживания
Администратор: Считаем справедливым не засчитать самую низкую оценку, поскольку ситуация разрешилась. Кроме того, как правило, мы оцениваем работу компании в урегулировании убытка.
Ответ на отзыв
Представитель СК
Виктор Юрьевич, Добрый день!Как и было условлено нами, в ходе телефонного разговора, ответ направлен Вам на электронный адрес.
Повторно хотелось бы сообщить, что все необходимые данные были переданы Страховой Компанией «Согласие» в РСА.
Обращаю внимание, что Страховая Компания «Согласие» единственная из Вашей страховой истории передала верные данные, с хэшем, который определяется при выгрузке. Данная информация была предоставлена сотрудником РСА в ходе телефонного разговора.
С уважением,
Оганисян Арсен Александрович,
Начальник Отдела
по работе с обращениями клиентов.
ООО «СК „Согласие“
г. Москва, ул.Гиляровского, д.42
тел.: +7(495) 739-01-01
e-mail: [email protected]
www.soglasie.ru
Особенности работы единой базы ОСАГО
С введением в 2013 году единой базы ОСАГО (АИС РСА) многиеавтовладельцы столкнулись с проблемами:то лапы ломит, то хвост отваливается, то КБм в базе неверный, то данных по водителю вообще нет в базе.
Для начала стоит дать краткую справку. Что такое КБм? КБм (коэффициент бонус-малус) – это система скидок за безаварийную езду; один из коэффициентов, применяемых для расчета стоимости полиса ОСАГО. Первоначально водителю присваивается коэффициент 1 (КБм=1). За каждый год без ДТП (по вине данного водителя) КБм уменьшается на 0,05. При виновности водителя в ДТП его КБм увеличивается в соответствии с таблицей КБм. Следовательно, те, кто с момента введения ОСАГО в 2003 году проездил без ДТП, должны сейчас иметь наименьший КБм=0,5.
Раньше при оформлении полиса ОСАГО достаточно было предъявить предыдущий полис ОСАГО, чтобы получить скидку по КБм. И хотя по Закону об ОСАГО для этого необходимо было предоставить справку из страховой компании о значении КБм, все закрывали на это глаза.
Теперь же полис для оформления ОСАГО необходимо получить данные из АИС РСА. Как я уже сказала, с базой постоянно возникают проблемы. Вместо маленького КБм в базе стоит 1 или другое неверное значение, по многим водителям данных в базе вообще нет. Проще всего сказать, что это страховые компании мошенничают, чтобы получить побольше денег. Давайте разберемся, почему же так происходит на самом деле.
Прежде всего, стоит отметить, что информация в базу вводится операторами, т.о. здесь присутствует простой человеческий фактор. Каждый может допустить ошибку. А если допущена ошибка хоть в одной букве или цифре, то Вы уже не сможете найти информацию о себе в базе.
Этим аспектом часто пользуются некоторые страховые компании, в особенности «Росгосстрах», специально делая ошибку в фамилии/имени или номере водительского удостоверения. В таком случае на следующий год водителю придется страховаться с КБм=1.
Еще одной причиной возникновения подобной ситуации может стать смена водительского удостоверения. Агент будет искать Вашу информацию в базе по номеру новых прав, а в базе указаны старые. Опять-таки данные агент не найдет. Если Вы поменяли в течение года водительское удостоверение, стоит попробовать сделать запрос в АИС по номеру старых прав.
На мой взгляд, самой обидной причиной ошибки в базе является банкротство страховой компании, в которой Вы застрахованы по ОСАГО. Такие компании чаще всего не успевают или просто не передают данные в базу, в которой не будет никакой информации о Вашем КБм.
Если Вы вписаны в несколько полисов ОСАГО с разными значениями КБм и информация по всем полисам занесена в базу, то при повторном страховании база выдаст наибольший коэффициент. Например, Вы вписаны в свой полис с КБМ=0,5 и в полис друга, у которого КБм=0,9 (при расчете стоимости полиса учитывается наибольший КБм по водителям) и в базу занесены оба полиса. В данном случае база присвоит Вам КБм=0,9.
Но чаще всего возникает совсем другая ситуация. К примеру, Вы застрахованы в страховой компании «А». Через год Вы решаете застраховаться в страховой компании «Б», которая не находит Ваши данные в АИС РСА и предлагает Вам застраховаться с КБм=1. Тогда Вы идете обратно в СК «А», которая не смотрит в единую базу, а смотрит куда-то в свою собственную базу данных и видит там реальные данные, по которым уже и страхует Вас. Этим очень часто промышляет уже названный выше «Росгосстрах».
Но не стоит расстраиваться раньше времени, если Вы попали в одну из таких ситуаций. Есть 2 пути решения:
1. Вы можете обратиться в Российский союз автостраховщиков (РСА) и подать жалобу. Необходимо будет также предоставить копии предыдущих полисов ОСАГО, справки о безубыточности из страховых компаний, в которых Вы были застрахованы. На сайте РСА можно скачать бланк претензии.
2. Вы можете обратиться в страховую компанию, в которой был оформлен последний полис и получить справку по форме №4 с указанием действующего КБм. Такую справку Вам обязаны выдать в страховой компании в течение 5 рабочих дней. На основании этой справки Вы сможете застраховаться в другой компании с реальным коэффициентом.
В заключении хочу отметить, что в связи со сложившейся практикой по определению КБМ. Некоторые недобросовестные агенты предлагают Вам оформить полис ОСАГО лишь на основании данных из предыдущего полиса. Соглашаясь с таким заманчивым предложением, Вы рискуете тем, что Ваш полис будет фальшивым.
Куда исчезает скидка на ОСАГО
Политика конфиденциальности
Введение
Мы стремимся уважать информацию личного характера, касающуюся посетителей нашего сайта. В настоящей Политике конфиденциальности разъясняются некоторые из мер, которые мы предпринимаем для защиты Вашей частной жизни.
Конфиденциальность информации личного характера
«Информация личного характера» обозначает любую информацию, которая может быть использована для идентификации личности, например, фамилия или адрес электронной почты.
Использование информации частного характера.
Информация личного характера, полученная через наш сайт, используется нами, среди прочего, для целей регистрирования пользователей, для поддержки работы и совершенствования нашего сайта, отслеживания политики и статистики пользования сайтом, а также в целях, разрешенных вами.
Раскрытие информации частного характера.
Мы нанимаем другие компании или связаны с компаниями, которые по нашему поручению предоставляют услуги, такие как обработка и доставка информации, размещение информации на данном сайте, доставка содержания и услуг, предоставляемых настоящим сайтом, выполнение статистического анализа. Чтобы эти компании могли предоставлять эти услуги, мы можем сообщать им информацию личного характера, однако им будет разрешено получать только ту информацию личного характера, которая необходима им для предоставления услуг. Они обязаны соблюдать конфиденциальность этой информации, и им запрещено использовать ее в иных целях.
Мы можем использовать или раскрывать Ваши личные данные и по иным причинам, в том числе, если мы считаем, что это необходимо в целях выполнения требований закона или решений суда, для защиты наших прав или собственности, защиты личной безопасности пользователей нашего сайта или представителей широкой общественности, в целях расследования или принятия мер в отношении незаконной или предполагаемой незаконной деятельности, в связи с корпоративными сделками, такими как разукрупнение, слияние, консолидация, продажа активов или в маловероятном случае банкротства, или в иных целях в соответствии с Вашим согласием.
Мы не будем продавать, предоставлять на правах аренды или лизинга наши списки пользователей с адресами электронной почты третьим сторонам.
Доступ к информации личного характера.
Если после предоставления информации на данный сайт, Вы решите, что Вы не хотите, чтобы Ваша Персональная информация использовалась в каких-либо целях, Вы можете исключить себя из списка ОНЭКСИМ, связавшись с нами по следующему адресу: [email protected]
Наша практика в отношении информации неличного характера.
Мы можем собирать информацию неличного характера о Вашем посещении сайта, в том числе просматриваемые вами страницы, выбираемые вами ссылки, а также другие действия в связи с Вашим использованием нашего сайта. Кроме того, мы можем собирать определенную стандартную информацию, которую Ваш браузер направляет на любой посещаемый вами сайт, такую как Ваш IP-адрес, тип браузера и язык, время, проведенное на сайте, и адрес соответствующего веб-сайта.
Использование закладок (cookies).
Файл cookie — это небольшой текстовый файл, размещаемый на Вашем твердом диске нашим сервером. Cookies содержат информацию, которая позже может быть нами прочитана. Никакие данные, собранные нами таким путем, не могут быть использованы для идентификации посетителя сайта. Не могут cookies использоваться и для запуска программ или для заражения Вашего компьютера вирусами. Мы используем cookies в целях контроля использования нашего сайта, сбора информации неличного характера о наших пользователях, сохранения Ваших предпочтений и другой информации на Вашем компьютере с тем, чтобы сэкономить Ваше время за счет снятия необходимости многократно вводить одну и ту же информацию, а также в целях отображения Вашего персонализированного содержания в ходе Ваших последующих посещений нашего сайта. Эта информация также используется для статистических исследований, направленных на корректировку содержания в соответствии с предпочтениями пользователей.
Агрегированная информация.
Мы можем объединять в неидентифицируемом формате предоставляемую вами личную информацию и личную информацию, предоставляемую другими пользователями, создавая таким образом агрегированные данные. Мы планируем анализировать данные агрегированного характера в основном в целях отслеживания групповых тенденций. Мы не увязываем агрегированные данные о пользователях с информацией личного характера, поэтому агрегированные данные не могут использоваться для установления связи с вами или Вашей идентификации. Вместо фактических имен в процессе создания агрегированных данных и анализа мы будем использовать имена пользователей. В статистических целях и в целях отслеживания групповых тенденций анонимные агрегированные данные могут предоставляться другим компаниям, с которыми мы взаимодействуем.
Изменения, вносимые в настоящее Заявление о конфиденциальности.
Мы сохраняем за собой право время от времени вносить изменения или дополнения в настоящую Политику конфиденциальности — частично или полностью. Мы призываем Вас периодически перечитывать нашу Политику конфиденциальности с тем, чтобы быть информированными относительно того, как мы защищаем Вашу личную информацию. С последним вариантом Политики конфиденциальности можно ознакомиться путем нажатия на гипертекстовую ссылку «Политика конфиденциальности», находящуюся в нижней части домашней страницы данного сайта. Во многих случаях, при внесении изменений в Политику конфиденциальности, мы также изменяем и дату, проставленную в начале текста Политики конфиденциальности, однако других уведомлений об изменениях мы можем вам не направлять. Однако, если речь идет о существенных изменениях, мы уведомим Вас, либо разместив предварительное заметное объявление о таких изменениях, либо непосредственно направив вам уведомление по электронной почте. Продолжение использования вами данного сайта и выход на него означает Ваше согласие с такими изменениями.
Связь с нами.
Если у Вас возникли какие-либо вопросы или предложения по поводу нашего положения о конфиденциальности, пожалуйста, свяжитесь с нами по следующему адресу: [email protected]
Что делать с полисом ОСАГО при смене водительского удостоверения
При использовании полиса ОСАГО важно следить за актуальностью внесенных в него сведений. Если информация в нем не будет совпадать с реальной, то такой документ будет признан недействительным, и вы не сможете оформить по нему страховую выплату. В первую очередь, это касается сведений о водительских удостоверениях. Подробнее о том, как поменять указанную в ОСАГО информацию о водительских правах, вы узнаете далее.
Что делать с полисом ОСАГО при смене водительского удостоверения
Любые изменения данных, вписанных в полис ОСАГО — в том числе номера и серии водительских прав — необходимо согласовывать со страховой компанией. При наличии расхождений с реальными сведениями, даже незначительных, страховку могут признать недействительной. В этом случае вы рискуете получить штраф как за отсутствие ОСАГО, а при наступлении страхового случая вам придется выплачивать компенсации из своего кармана.
Поэтому, если у одного из водителей, вписанных в полис, изменилось удостоверение, вам нужно будет внести изменения в документ. Перезаключать договор при этом не потребуется — достаточно будет заключить дополнительное соглашение и поставить соответствующую отметку в полисе.
Если вы оформили полис-мультидрайв, то вносить в него изменения после замены прав не нужно. В такой документ информация о ВУ не заносится. Вы и другие водители сможете пользоваться такой страховкой после замены прав. Однако, при расчете такого полиса не учитываются возраст, стаж и КБМ водителей.
Как вносятся изменения
Порядок внесения изменений зависит от того, каким способом оформлен полис. Если у вас бумажный ОСАГО, то вам нужно будет заполнить заявление в отделении страховой компании и предоставить подтверждающие документы. После рассмотрения заявки страховщик поставит отметку об изменении прав на полисе или перевыпустит его на новом бланке.
Заполнять заявление должен страхователь лично или его представитель, имеющий нотариально заверенную доверенность. Если права изменились у другого водителя, вписанного в страховку, то достаточно будет предоставить его удостоверение — личное присутствие человека не потребуется.
Если полис был оформлен онлайн, то для изменения сведений войдите в личный кабинет на сайте страховщика, выберите нужный полис и укажите опцию редактирования. Укажите сведения, которые нужно изменить, и загрузите скан-копии требуемых документов. После проверки данных и внесения изменений страховая компания вышлет новый полис на электронную почту.
Для внесения изменений в ОСАГО вам потребуются следующие документы:
- Паспорт страхователя
- ПТС и СТС автомобиля
- Действующий договор ОСАГО
- Квитанция об оплате страховки
- Новые водительские удостоверения
Изменения в полисе ОСАГО вступают в силу в течение 2-3 рабочих дней после их внесения. Это время требуется, чтобы страховая компания передала всю необходимую информацию в РСА.
Сколько стоит внесение новых данных
Страховая компания имеет право взять комиссию за внесение изменений в ОСАГО. В одних случаях это может быть разница между стоимостью полиса на старых и новых условиях. В других — это фиксированная комиссия, которая установлена страховщиком.
Чтобы узнать, сколько будет стоить внесение новых данных, вам нужно уточнить способ определения комиссии в вашей СК. Если комиссия — разница в стоимости полиса, то для ее определения рассчитайте страховку с новыми данными и вычтите из нее стоимость действующего полиса. Если комиссия фиксированная — уточните ее размер у страховщика.
Что будет, если не изменить номер прав в полисе вовремя
Главная причина, по которой не следует затягивать с внесением изменений в ОСАГО — риск признания страховки недействительной. В этом случае вы не сможете использовать ее для оформления компенсаций пострадавшим по вашей вине в аварии. Признать полис недействительным могут в любой момент, в том числе и при получении страховой выплаты.
Кроме того, слишком долгое внесение изменений в ОСАГО может грозить потерей накопленного КБМ. Этот коэффициент привязывается к номеру водительского удостоверения. При изменении этого номера накопленный КБМ может быть потерян. В итоге при оформлении страховки с новыми правами вы не сможете получить скидку на безаварийное вождение.
Поэтому при замене указанных в ОСАГО прав укажите в заявлении пункт о сохранении накопленного КБМ. Страховщик привяжет коэффициент к новому удостоверению, что позволит вам не потерять его.
В каких случаях нужно заключать новый страховой договор
Существует ряд ситуаций, когда невозможно обойтись простым внесением изменений в действующий полис — вам придется переоформлять его заново. Это необходимо в следующих ситуациях:
- Утеря, кража или порча полиса
- Изменение паспортных данных (ФИО, номера и серии паспорта) у собственника авто
- Изменение собственника автомобиля — например, при его продаже
- Изменение автомобиля, на который необходимо оформить страховку
- Изменение периодов использования транспортного средства
- Изменение типа полиса на мультидрайв
В этих случаях необходимо будет заключить новый договор со страховой компанией. При изменении собственника предыдущий договор должен быть расторгнут — только после этого новый владелец сможет оформить ОСАГО на свое имя.
Заключение
Не затягивайте с переоформлением ОСАГО после изменения данных водителей. Это позволит вам избежать возможных проблем и сохранить действующие коэффициенты. На время внесения изменений старайтесь не пользоваться автомобилем — в течение этого срока страховка будет временно неактивной. Если в полис вписано несколько водителей — согласуйте изменения с каждым из них.
Источники
Виталина СлепуховаОдна из ведущих журналистов проекта. В кредитной сфере с 2008 года. Имеет высшее образование по специальности «Банковское дело». Публикуется в интернет-издании газеты Коммерсантъ. Большой опыт в финансовой сфере помогает ориентироваться на рынке микрофинансовых и банковских услуг и видеть самые важные события.
[email protected] (10 оценок, среднее: 4.9 из 5)
Как исправить неверный КБМ в базе РСА — Юридическая консультация
Ошибки при расчете коэффициента бонус-малус (КБМ) возникают чаще других.
Причины могут быть разными. Например, человек менял водительское удостоверение или покупал полисы ОСАГО в разных компаниях, и они рассчитывали КБМ только по своим данным.
Бывают случаи, когда водитель меняет права в период, когда у него нет полиса ОСАГО (допустим, несколько месяцев или даже лет он не пользовался машиной). Тогда ему нужно обязательно сообщить о замене удостоверения, когда он придет покупать новый полис.
Если этого не сделать, то страховщик не передаст информацию в Российский союз автостраховщиков (РСА). Новое удостоверение окажется не связанным с предыдущей страховой историей водителя. В базе РСА он будет значиться как новичок. И его КБМ станет равным единице.
Если это обнаружится в момент покупки нового полиса, надо попросить страховую компанию актуализировать информацию в базе РСА. И тогда, если у вас был низкий КБМ, вы сможете получить скидку на новую страховку.
Если водителю кажется, что КБМ в базе РСА указан неверно, нужно обратиться в страховую компанию, которая оформила ему последний полис ОСАГО, написать заявление в свободной форме с требованием проверить коэффициент бонус-малус, указав, в каких страховых компаниях ОСАГО приобреталось ранее.
Страховщик перенаправит запрос в Российский союз автостраховщиков. РСА в течение пяти рабочих дней проведет проверку. Если выяснится, что какие-то компании ранее подали о водителе неверные или противоречивые сведения, РСА будет трактовать любые ошибки в его пользу. И если в базе окажется несколько КБМ по данным от разных страховщиков, в базу РСА будет внесен минимальный.
Затем РСА сообщит об итогах проверки страховой компании, а она должна передать эту информацию водителю. Если выяснится, что какой-то из коэффициентов был неверным, компания пересчитает цену полиса.
Если вы не получите ответ от страховщика в течение 10 дней после запроса, можно обратиться напрямую в РСА или в интернет-приемную Банка России на сайте регулятора.
Даже если водитель заметил ошибку страховой компании уже после покупки полиса, можно потребовать пересчитать его стоимость и вернуть разницу. Более того: это можно сделать, даже если КБМ исправили уже после того, как была куплена страховка.
Если же страховая компания несколько лет подряд рассчитывала завышенную цену полиса из-за неверного КБМ, можете потребовать у нее вернуть деньги, которые водитель переплатил за последние три года.
Нужно прийти в страховую компанию, в которой был куплен полис, и написать заявление в свободной форме. В нем потребовать пересчитать стоимость полиса на основании правильных коэффициентов. В заявлении укажите реквизиты счета, на который нужно перевести возвращенные деньги.
Страховщик обязан внести изменения в полис или выдать водителю новый в течение двух рабочих дней после обращения.
Деньги должны перечислить на счет в течение 14 календарных дней после обращения. Если деньги не вернули и полис не исправили, можно обратиться с жалобой в интернет-приемную Банка России.
Автолюбитель 73 » Архив блога Как внести изменения в базу данных РСА
Dmitry | 19 апреля 2016 19:28 |Как внести изменения в базу данных РСА
Итак, водительское удостоверение получено. О предварительных этапах, непосредственно о получении водительского удостоверения возможно прочитать в записях «Замена водительских прав», «Новое водительское удостоверение и медицинская справка».
Но если хотите сохранить коэффициент бонус-малус при получении очередного полиса ОСАГО, необходимо обратиться в страховую компанию после замены водительского удостоверения, чтобы внести в базу данных РСА серию, номер нового водительского удостоверения. В моём случае в базу данных также надо внести данные нового паспорта РФ.
Если не заявить о новых данных до момента, как будете оформлять новый полис ОСАГО, потеряете скидку при оплате полиса. В свете подорожаний полисов в последнее время, думаю, скидка никому не помешает.
Самое первое, поискал информацию на сайте страховой компании. Ничего не нашёл. Придётся ехать в офис страховой.
Так случилось, что появилось время в первой половине рабочего дня. Приехал в офис. Ни одного посетителя. Пришлось поискать кабинет, где возможно получить консультацию по интересующему меня вопросу. Оказалось, что внесением данных в базу данных РСА занимается отдел продаж полисов ОСАГО.
Предоставил менеджеру новый паспорт, водительское удостоверение, копию полиса ОСАГО, так как у меня электронный полис.
Процедура заняла примерно 10 минут. Менеджер распечатала заявление о внесении изменений в базу данных, в котором надо поставить только подпись.
Также мне оформили полис на фирменном бланке. Теперь нет необходимости объяснять сотрудникам ГИБДД, почему я предоставляю копию полиса, а не оригинальный бланк.
Вся процедура совершенно бесплатная.
Перед уходом ещё раз уточнил, сохранится ли у меня КБМ при оформлении электронного полиса на очередной год. На что получил утвердительный ответ.
Но несмотря на утвердительный ответ, решил проверить сам по базе данных в личном кабинете. Проверил. Всё точно. Новые данные паспорта и водительского удостоверения занесены в базу данных.
Ещё записи по теме:
ПОДЕЛИТЕСЬ НАШЕЙ СТАТЬЕЙ С ДРУЗЬЯМИ
Рубрика: Практические советы, Экономика и деньги | комментариев 6 »
Восстановить КБМ после замены прав бесплатно и платно
Обратиться в Российский Союз Автостраховщиков: Если не получилось договориться о пересмотре вашего коэффициента бонус-малус в страховой компании и после обращения в Центральный Банк, следующий шаг — обратиться в РСА.
Сам по себе Центральный Банк не может изменить значение КБМ для вашего полиса ОСАГО, но может повлиять на решение обратить больше внимания на вашу жалобу по начислению. Если вы обращаетесь напрямую в базу РСА, вы можете рассчитывать на то, что данные по вашему коэффициенту обновят. Останется подать заявлению в страховую на возвращение компенсации за неправильно рассчитанный коэффициент бонус-малус.
Есть два способа обратиться в РСА: по почте или при помощи электронной приемной. Чтобы отправить свою жалобу, нужно зайти на сайт Российского Союза Автостраховщиков и скачать бланк заявления. После этого отправить через «Почту России» и ждать ответного письма. Если нужно обратиться через электронную приемную в РСА — нужно найти страницу на сайте, где заполняется информация о жалобе на страховую компанию.
Все приведенные три способа нелегкие: нужно обращаться в страховую компанию, после в Центральный Банк и в конце в Российский Союз Автостраховщиков. Если все эти способы не помогут — обращайтесь через суд. Это последняя инстанция, которая поможет вам вернуть ваш прежний коэффициент бонус-малус.
Есть еще один способ, чтобы восстановить КБМ и не ждать долгого ответа от страховой компании, Центробанка и РСА. Вы можете воспользоваться специальными сайтами, которые отправляют запросы напрямую в РСА, ответ приходит в течение дня и не нужно заполнять множество полей.
Автострахование ОСАГО. Как рассчитывается скидка
Почему не верно насчитывается скидка?
Если Вы не согласны с рассчитанным размером скидки — позвоните нам по бесплатному номеру 8-800-250-7177 и мы поможем Вам разобраться, почему скидка рассчиталась не верно.
Как рассчитывается скидка?
Скидка рассчитывается на основании данных КБМ. КБМ – коэффициент бонус-малус. Коэффициент безаварийного вождения. Изначально у всех водителей устанавливается коэффициент 1,0. За каждый код безаварийной езды значение коэффициента уменьшается на 5%.
Значение КБМ в соответствии с требованием законодательства РФ определяется на основании данных АИС РСА. Для расчета КБМ необходимы данные водителей: Фамилия Имя Отчество, дата рождения, серия и номер водительского удостоверения, стаж вождения — дата начала.
На нашем сайте настроена автоматическая интеграция с данными базы АИС РСА, в которой хранятся все данные для расчета КБМ. Данные в АИС РСА передаются Страховой компанией при оформлении полиса ОСАГО. В связи с этим, мы рассчитываем скидку непосредственно из базы АИС РСА на основании данных, которые заполняете Вы для расчете скидки на нашем сайте.
Возможные причины не верного расчета скидки
1) Страховая компания (Страховщик) при фоормлении полиса ОСАГО подала неправильную информацию в базу данных АИС РСА.
2) Произошла смена водительского удостоверения в период действия полиса ОСАГО и Вы не обратились в Страховую компанию, которая оформляла полис ОСАГО для внесения изменений в действующей полис и базу данных АИС РСА. В этом случае, в базе данных АИС РСА, хранится информация по скидке, рассчитанной на предыдущее водительское удостоверение. Данных по новому водительскому удостоверения в АИС РСА нет, в связи с этим скидка не рассчитывается.
Чтобы сохранить скидку при оформлении нового полиса ОСАГО, Вам необходимо обратиться в Страховую компанию, в которой вы оформили действующий полис ОСАГО или напрямую в АИС РСА, для внесения данных в новое водительское удостоверение.
При оформлении страховки ОСАГО на нашем сайте, в некоторых случаях, мы можем самостоятельно внести изменения в базу данных АИС РСА, после этого оформить полис ОСАГО со скидкой на новое водительское удостоверение. Для уточнения данной информации, пожалуйста обратитесь по бесплатному телефону 8-800-250-7177.
3) При смене водительского удостоверения Вы обратились в Страховую компанию, которая оформляла полис ОСАГО, для внесения изменений в действующий полис и базу данных АИС РСА для сохранения скидки. Но страховая компания не передала данные по новому водительскому удостоверению в АИС РСА.
Что делать если скидка не верная?
Если Вы не согласны с установленным значением КБМ, Вы можете направить соответствующий запрос в РСА, который является оператором базы данных по ОСАГО. В базе данных АИС РСА есть информация по всем договорам ОСАГО и по всем страховым компаниям, в которых могла быть застрахована Ваша ответственность по ОСАГО. Если РСА будут выявлены неточности при передаче данных по водителям или примененным КБМ, то такие данные подлежат корректировке. С учетом всей «истории страхования» по каждому водителю база данных определяет значение коэффициента КБМ, которое мы и обязаны применять при заключении договоров ОСАГО с любым автовладельцем.
Адрес АИС РСА, необходимый для обращения, вы можете найти в образце заявлении для обращения в АИС РСА, который вы можете скачать по ссылке ниже:
Скачать заявление для обращения в РСА
Страхование ОСАГО
Калькулятор ОСАГО онлайн
Что такое ОСАГО?
Что защищает ОСАГО?
От чего не защищает ОСАГО?
Ответственности за отсутствие полиса ОСАГО
Кто устанавливает тарифы на ОСАГО?
Как сэкономить на ОСАГО?
Как увеличить лимит по ОСАГО?
Размеры выплат ОСАГО
Страховые компании ОСАГО
Как купить страховку ОСАГО онлайн?
Как рассчитывается КБМ
Возможные причины не верного расчета скидки ОСАГО
Что делать если скидка ОСАГО не верная?
Сколько стоит ОСАГО
Формула расчета ОСАГО
Двухфакторный анализ главных компонентов для данных с вариациями матриц с приложением к данным функциональной магнитно-резонансной томографии
Биостатистика. 2017 Apr; 18 (2): 214–229.
Лей Хуанг 1 Департамент биостатистики, Школа общественного здравоохранения Блумберга Джонса Хопкинса, 615 Н. Вулф-стрит, Балтимор, Мэриленд 21205, США moc.liamg@recargnauh Филип Т. Рейсс2 Департамент детской и подростковой психиатрии и Департамент здоровья населения, Нью-Йоркский университет, One Park Avenue, 7th Floor, NewYork, NY 10016, США, и Департамент статистики Хайфского университета, 199 Aba Khoushy Ave ., Mount Carmel, Хайфа 3498838, Израиль
Ло Сяо3 Департамент статистики, Государственный университет Северной Каролины, 5109 Sas Hall, 2311 Stinson Drive, Raleigh, NC 27695, США
* Кому адресовать корреспонденцию.
Поступила 2 сентября 2015 г .; Пересмотрено 10 мая 2016 г .; Принято 21 июля 2016 г.
Авторские права © Автор, 2016 г. Опубликовано Oxford University Press. Все права защищены. Для получения разрешений обращайтесь по электронной почте: [email protected]. Эту статью цитировали в других статьях в PMC.РЕЗЮМЕ
Многие современные исследования нейровизуализации получают большие пространственные изображения мозга, наблюдаемые последовательно во времени. Такие данные часто хранятся в виде матриц. Чтобы смоделировать эти данные с переменной матрицей, мы вводим класс разделяемых процессов, используя явное моделирование скрытых процессов. Чтобы учесть размер и двустороннюю структуру данных, мы расширяем анализ главных компонентов, чтобы добиться уменьшения размерности на индивидуальном уровне.Мы вводим необходимые условия идентифицируемости для каждой модели и разрабатываем масштабируемые процедуры оценки. Этот метод основан на функциональном исследовании магнитно-резонансной томографии, предназначенном для анализа взаимосвязи между болью и мозговой активностью, и применяется к нему.
Ключевые слова: фМРТ, моделирование скрытых процессов, матрица-вариация, анализ главных компонентов, разделимость
1. ВВЕДЕНИЕ
Функциональная магнитно-резонансная томография, зависящая от уровня кислорода в крови (ЖИРНАЯ фМРТ), измеряет активность мозга путем обнаружения изменений в крови оксигенация и кровоток, связанные с активностью нейронов (Huettel и другие , 2004), тем самым предоставляя исследователям средства для изучения функции человеческого мозга in vivo .Во время стандартного эксперимента фМРТ получают несколько сотен изображений головного мозга (каждое из которых включает измерения примерно в 100 000 единиц объема, или вокселей), в то время как субъект выполняет последовательность задач. Затем изменения измеряемого сигнала между изображениями используются, чтобы сделать выводы о возможных связанных с задачей активациях в мозге. За последние два десятилетия фМРТ использовалась для успешной локализации областей мозга, активируемых задачей, определения распределенных сетей, соответствующих функциям мозга, и прогнозирования психологических или болезненных состояний (Lindquist, 2008).Стандартные данные фМРТ демонстрируют сложную двустороннюю (пространственную и временную) структуру с относительно слабым сигналом. Следовательно, данные не только огромны по размеру, но и очень сложны.
Методологические разработки, представленные здесь, были мотивированы фМРТ-исследованием термической боли, проведенным на 20 пациентах (Lindquist, 2012). Каждого испытуемого сканировали, когда он подвергался серии испытаний на боль, состоящих из термической стимуляции левого ладонного предплечья. Количество испытаний для каждого субъекта варьировалось от 45 до 52, всего 940 испытаний для 20 субъектов.Для каждого испытания случайным образом был назначен один из двух уровней теплового моделирования: температура была откалибрована как болезненная (горячая) или неболезненная (теплая) с использованием задачи калибровки боли, выполняемой перед сканированием. Каждое испытание длилось 46 с. После 18-секундного интервала, состоящего из термической стимуляции, предъявлялся крест фиксации для 14-секундного интервала, в конце которого слова «Насколько болезненно?» появился на экране. После нескольких секунд созерцания участник оценил общую интенсивность боли от 100 до 550, где большие значения указывают на усиление боли.Перед анализом данные были извлечены из 21 различных классических чувствительных к боли областей мозга. Для каждого 46-секундного испытания измерения проводились каждые 2 с, в результате получалось 23 точки отбора проб. Таким образом, данные, которые мы рассматриваем в этом исследовании, состоят из 21 местоположения, наблюдаемого в 940 испытаниях, каждое из которых состоит из временного ряда длиной 23 (что соответствует 46 секундам активации мозга). Мы обозначаем наблюдаемые данные фМРТ для каждого испытания как где и — индексы для пространственной и временной областей, соответственно. Эти данные имеют естественную двустороннюю пространственно-временную структуру.Здесь мы отображаем данные фМРТ для двух случайно выбранных испытаний от первых трех субъектов. На каждой панели ось x представляет время от 0 (начало термической стимуляции) до 46 с (конец оценки боли), а ось y представляет ЖИРНЫЙ сигнал фМРТ от 21 различных классических реагирующих на боль головного мозга. регионы проиндексированы от 1 до 21 (см. Таблицу S.1 в дополнительных материалах, доступных на сайте Biostatistics онлайн). Не было известной априори пространственной корреляции между этими регионами.Интенсивность фМРТ имеет цветовую кодировку от темно-красного (значения низкой интенсивности) до светло-желтого (значения высокой интенсивности). Одна из основных целей этого исследования — выявить паттерны фМРТ, которые могут соответствовать болевым раздражителям.
Измерения интенсивности фМРТ по 21 местоположению в 23 временных точках по двум объектам.
Одним из возможных первых шагов является выполнение анализа главных компонентов (PCA) для данных матричного типа. Причина, по которой мы фокусируемся на PCA, заключается в том, что это подход первой линии для захвата образов и уменьшения размерности, а также широко используется в исследованиях фМРТ.Например, при выполнении анализа независимых компонентов (ICA) часто начинают с PCA во временной области (PCA временного ряда) в качестве этапа предварительной обработки, чтобы уменьшить размерность и смягчить влияние шума (Hyvärinen and Oja, 2000; Calhoun и другие , 2001). Более того, несколько авторов (например, Viviani и другие , 2005; Lindquist, 2008) выступали за использование PCA в качестве подхода, управляемого данными, для характеристики закономерностей в данных.
Существует три основных подхода к использованию PCA непосредственно в анализе данных фМРТ.В первом и втором подходах можно просто суммировать сканирование по одному домену (времени или месту) и проводить временный или пространственный PCA по другому домену. Например, пространственное наложение может быть достигнуто путем простой векторизации данных для каждого местоположения. Для региона это приведет к вектору. Затем этот вектор может быть сгруппирован по строкам, что приведет к размерной матрице 21 на 21 620. PCA в столбцах этой матрицы обычно называется пространственным PCA и создает собственные изображения. Подобное суммирование может быть выполнено для получения временного PCA.Третий подход — это декомпозиция численности населения (PVD), предложенная Caffo и другими (2010) и Crainiceanu и другими (2011). PVD использует двухэтапную декомпозицию по сингулярным значениям (SVD) для извлечения основных компонентов на уровне совокупности по каждому измерению. SVD первого этапа реализуется на каждом, а SVD второго этапа реализуется на производных собственных векторах из предыдущего этапа.
То, что мы предлагаем здесь, связано с этими подходами, но принципиально отличается, поскольку мы явно моделируем пространства строк и пространство столбцов отдельно.В частности, мы включаем двустороннюю структуру данных фМРТ в PCA путем явного моделирования с использованием скрытых процессов при определенных предположениях о разделимости. Основные статьи этой статьи заключаются в следующем. Во-первых, за счет введения явных предположений об отделимости размерность ковариационной матрицы будет существенно уменьшена. Действительно, PCA для объединенных данных потребует диагонализации -размерных матриц, тогда как PCA для разделяемого процесса будет иметь размерность, где и — количество строк и столбцов для каждой наблюдаемой матрицы, соответственно.В нашем исследовании фМРТ, а. Во-вторых, индуцированный двусторонний PCA обеспечит явную декомпозицию данных в соответствии с предположениями об отделимости. Это в сочетании с линейной моделью смешанных эффектов (LMM) позволит в будущем строить модели для продольных или иерархических данных. В-третьих, предлагаются три разных типа разделяемых моделей (аддитивная, мультипликативная и гибридная), которые будут полезны при различных сценариях. В-четвертых, выведены быстрые алгоритмы, основанные на методе моментов, и будут тщательно изучены условия идентифицируемости для каждой модели.
Двустороннее матричное моделирование — очень активная область исследований. Недавно Аллен и другие (2014) представили двусторонний SVD для матриц для учета возможно коррелированных остатков. Корреляционная структура остатков была учтена с использованием допущения об отделимости остатков. Напротив, мы налагаем разделимость на сигнальную часть модели. Это достигается путем явного моделирования скрытых процессов сканирования. Это позволяет легко обобщить нашу модель для получения более сложных данных, которые могут включать многоуровневые и продольные планы, а также непостоянные результаты.Spencer и другие (2001) и Dien и другие (2003) предложили двухэтапный PCA, который последовательно выполняет пространственный PCA и временной PCA, в то время как наш метод оценивает главные компоненты из двух областей одновременно при явной разделимости модели. предположения.
Как заметил один из обозревателей, наша гибридная модель очень похожа на ANOVA-одновременный компонентный анализ (Smilde и другие , 2005). Во-первых, в обеих статьях рассматриваются двусторонние матричные структуры.Во-вторых, обе статьи посвящены разложению дисперсии. Более того, разложение дисперсии использует явное моделирование на основе скрытых переменных. Однако между этими двумя методами есть и некоторые фундаментальные различия. Во-первых, в Smilde и других (2005) разные матричные наблюдения могут иметь разные размеры (т.е. количество строк разное). Это побудило авторов использовать одновременный компонентный анализ. В наших данных размеры каждого матричного наблюдения фиксированы.Поэтому мы сосредотачиваемся на изучении разделимости между строками и столбцами. Во-вторых, в модели Смилде нет предположения о разделимости, в то время как мы предполагаем, что строки и столбцы разделимы. Меньшее количество ограничений в Smilde и других (2005) делает их модель более общей. Однако с дополнительными предположениями наша модель более выполнима с точки зрения вычислений. Кроме того, как обсуждалось в нашем последнем разделе, наша модель может быть расширена, чтобы включить взаимодействие как сумму нескольких разделяемых процессов для достижения лучшего приближения.В-третьих, на этапе PCA для SCA Smilde и другие (2005) объединили строки и спроецировали данные в общее пространство столбцов, в то время как наши методы одновременно выполняют PCA в пространствах строк / столбцов.
Остальная часть статьи организована следующим образом. В разделе 2 мы представляем три модели, основанные на различных предположениях отделимости. Мы обсуждаем соответствующие условия идентифицируемости и выводим их ковариационные структуры. В разделе 3 мы предлагаем алгоритм оценки двустороннего PCA.В разделе 4 представлено моделирование исследования, а в разделе 5 представлены подробные результаты для анализа исследования боли с помощью фМРТ. Мы завершаем статью обсуждением потенциальных будущих исследований в Разделе 6. Все технические доказательства делегированы дополнительным материалам, доступным на сайте Biostatistics онлайн.
2. РАЗДЕЛЯЕМЫЕ МОДЕЛИ ДЛЯ ДАННЫХ ДВУСТОРОННЕЙ МАТРИЦЫ-ВАРИАТА
В этой статье «разделимость» означает свойство, согласно которому изменчивость наблюдаемых матриц может быть разделена на специфичные для строк и специфичные для столбца компоненты.Мы вводим три различных типа отделимости: аддитивную, мультипликативную и гибридную.
2.1 Модель с отделяемой добавкой
Модель с отделяемой аддитивной
X i ( с , t ) = μ ( с , t ) + C i + U ( с ) + V i ( t ) + ε i ( s , t ),
(2.1)
где буквы и обозначают индексы строк и столбцов в матрице. В модели (2.1) наблюдаемый результат матрицы раскладывается как линейная сумма детерминированной матрицы средних значений, случайного отклонения, зависящего от сканирования и инвариантного столбца, случайной величины для конкретной строки, случайной величины для конкретного столбца и случайная величина белого шума. Предполагается, что случайные величины равны i.i.d. (независимо и одинаково распределены) с нулевым средним и дисперсией, в то время как и предполагаются равными i.я бы. с нулевым средним и ковариациями и соответственно. Предполагается, что шумовой член равен i.i.d. нормальные случайные величины с распределением.
Аддитивное представление не является уникальным: добавление константы к и вычитание той же константы из не изменит их сумму. Следующий результат обеспечивает необходимые условия идентифицируемости для модели (2.1).
Дополнительный материал S.2, доступный на сайте Biostatistics онлайн, предоставляет доказательство этой теоремы. Хотя предположения А.1 – A.3 относительно стандартны, предположение A.4 — менее. Интуиция для предположения A.4 заключается в том, что вся изменчивость данных, инвариантная по строкам и столбцам, улавливается случайным эффектом. Можно показать, что из предположения A.4 следует, что все собственные векторы и ортогональны постоянному вектору. Предположение A.5 обеспечивает гладкость ковариации для или, которая необходима для случайного шума, от скрытых процессов, и.
2.3. Разделимая гибридная модель
Наша третья модель представляет собой комбинацию разделимой аддитивной и мультипликативной моделей:
X i ( s , t ) = μ ( s , t ) + C i + ( с ) + V 1 i ( t ) + U 2 i ( s ) V 2 i + ε i ( s , t ).
(2.3)
Как и в моделях (2.1) и (2.2), является инвариантным компонентом строка-столбец, является инвариантным для столбца компонентом, является инвариантным для строки компонентом, является взаимодействием первого порядка между строкой и столбцом. пробелы и белый шум. Чтобы гарантировать идентифицируемость, мы предполагаем, что это некоррелировано, и все процессы, специфичные для строк, не коррелируют с процессами, специфичными для столбцов. Однако нулевая корреляция между процессами, специфичными для строк, а также для конкретных столбцов, не требуется.Подробные условия идентифицируемости (теорема 3) можно найти в дополнительном материале S.4, доступном на сайте Biostatistics онлайн.
2.4. Оценка модели
Чтобы оценить общую производительность модели, мы вычисляем долю дисперсии, объясняемую моделью. Используя аналогию со статистикой в регрессионном анализе, доля дисперсии, объясняемая аддитивным компонентом в аддитивной разделимой модели, равна
R2 = STVc + Ttr {ΣU} + Str {ΣV} tr {ΣX}.
На практике оценка, относящаяся к разделимым моделям, может быть от небольшой до умеренной. Причины этого могут заключаться в том, что либо разделяемых компонентов недостаточно, чтобы уловить наблюдаемую изменчивость, либо белый шум очень велик, либо и то, и другое.
Если оцененные остатки демонстрируют высокий уровень пространственной и / или временной корреляции, то можно обобщить гибридную модель, включив в нее дополнительные мультипликативные разделяемые члены. Идея аналогична идее аппроксимации матрицы с помощью сумм матриц произведений Кронекера (Van Loan and Pitsianis, 1992).В частности, гибридная модель может быть расширена как
Xi (s, t) = μ (s, t) + Ci + U1i (s) + V1i (t) + ∑k = 2KUki (s) Vki (t) + εi (s, t),
куда . Детали оценки и вывода для этой модели выходят за рамки этой рукописи, хотя она лежит в основе гибкости, которая может быть достигнута путем построения явного разделяемого моделирования. Мы утверждаем, что базовая разделяемая гибридная модель очень полезна для исследовательских целей.
3. РАЗДЕЛЯЕМЫЙ ДВУСТОРОННИЙ МАТРИЦА-ВАРИАНТ PCA
Наш интерес сосредоточен на получении PCA-разложений ковариационных матриц для скрытых процессов в моделях (2.1) — (2.3). Идея состоит в том, что PCA может существенно снизить сложность моделирования, определяя только основные направления изменения в пространствах строк и столбцов. Выполнение PCA методом грубой силы непосредственно на исходной матрице имеет три недостатка: (i) часто трудно визуализировать и интерпретировать каждый главный компонент, поскольку каждый ПК является двусторонней матрицей; (ii) получение двусторонних ПК требует больших вычислительных ресурсов из-за большой размерности матрицы; и (iii) вычисление главных компонентов не принесет пользы от известной лежащей в основе двусторонней структуры, что может привести к излишне сложным разложениям.
В этих разделах мы представляем методы PCA, которые учитывают определенные допущения об отделимости. Для упрощения записи мы будем использовать матричное представление данных. Пусть — размерная матрица,
Xi = (Xi (s1, t1) Xi (s1, t2) … Xi (s1, tT) Xi (s2, t1) Xi (s2, t2) … Xi (s2, tT) … ……… Xi (sS, t1) Xi (sS, t2) … Xi (sS, tT)),
куда . Аналогично, мы определяем ,,, и быть векторами, и while — это матричное представление для. Ковариационные матрицы для, и обозначаются как, и, соответственно.
Наша общая процедура оценки состоит из следующих шести шагов.
Оцените среднее значение.
Оцените дисперсию шума.
Оцените ковариацию и воспользуйтесь методом моментов.
Выполните собственное разложение для получения оценок собственных значений (хранящихся в векторе) и собственных векторов (хранящихся в матрице).
Выполните собственное разложение для получения оценок собственных значений (хранящихся в векторе) и собственных векторов (хранящихся в матрице).
Оцените основные баллы (хранящиеся в векторах и для и, соответственно).
Теперь мы предоставим пошаговое описание деталей, связанных с методом оценки.
Шаг 1
В этой статье мы используем средние эмпирические значения для оценки и вычитания их из наблюдаемых данных. Также могут применяться другие методы оценки двумерной функции (Xiao и др. , 2013). Для простоты мы по-прежнему обозначаем униженный процесс как.
Шаг 2
Чтобы оценить дисперсию белого шума, мы применяем недиагональное сглаживание (Станисвалис и Ли, 1998; Гревен и др. , 2010) ко второй оценке момента вектора ковариации пространства столбцов. Например, в модели (2.3) с белым шумом имеем
E [XiT1S1STXi] = S2VC1T1TT + S2ΣV1 + Sσε2IT.
Так как является гладким согласно предположению H.10, также является гладким, и термин просто добавляет необычно большие значения по диагонали.Аналогичный подход можно использовать для пространства строк, если предполагается, что он гладкий. Недиагональная процедура заключается в следующем: (i) вычислить эмпирические оценки; (ii) извлечь диагональ как вектор; (iii) выполнить двумерное сглаживание на основе всех недиагональных элементов и спрогнозировать новый диагональный вектор; и (iv) усреднить разницу между и и использовать среднее значение в качестве оценки.
На практике метод недиагонального сглаживания иногда переоценивает дисперсию шума, особенно при низком отношении сигнал / шум.Это может привести к тому, что оцененная матрица ковариации будет иметь отрицательные собственные значения. Одна альтернатива — установить верхнюю границу для оцененной дисперсии шума путем определения наименьшего собственного значения исходной ковариационной матрицы. Точнее, собственные значения второго момента с шумом могут быть разложены на собственные значения вторых моментов без шума и постоянной дисперсии белого шума. Посмотрев на наименьшее собственное значение оцененной ковариационной матрицы (где нешумовая часть мала), мы можем обеспечить верхнюю границу дисперсии белого шума.Насколько нам известно, это новый метод, который стабилизирует оценки дисперсии шумовой ошибки и улучшает исходный метод Станисвалиса и Ли (1998).
Подобные методы оценки можно применить к моделям (2.1) и (2.2). На практике, если или является маленьким, относительно или, мы можем просто игнорировать термин шума (т. Е. Настройку). Это связано с тем, что (i) недиагональное сглаживание недостаточно чувствительно для разделения шумового члена; (ii) смещение для или не превышает или, что обычно незначительно из-за больших или в многомерных случаях.ε2IT},
где — нормализующая постоянная, обеспечивающая условие идентифицируемости H.8.
В традиционной литературе по PCA (Jolliffe, 2002) оценка часто включает вычисление эмпирической оценки общей ковариационной функции, что требует сохранения параметров. Когда или велико, такая оценка уровня популяции невозможна с вычислительной точки зрения. Вместо этого, благодаря возможности разделения, наша процедура требует хранения только параметров.
Шаг 4
Мы используем методы проекции для оценки векторов оценок.Остается неясным, как оценивать отдельные векторы оценок и. В этой статье мы сосредоточимся на оценке продуктов, что является гораздо более простой задачей. Все детали вычислений можно найти в дополнительном материале S.5, доступном по адресу Biostatistics онлайн.
Выбор количества основных компонентов — важная практическая задача, не имеющая теоретически удовлетворительного решения. Двумя практическими альтернативами являются использование перекрестной проверки (Райс и Сильверман, 1991) или информационного критерия Акаике (Акаике, 1974; Яо и др. , 2005).Можно выбрать еще более простой метод оценки количества компонентов на основе оцененной объясненной дисперсии; этот подход широко используется на практике и, по-видимому, является наиболее распространенным подходом. Точнее, пусть будет порог и определим
где и, th элемент вектора, это собственное значение для. В нашем анализе мы использовали. Мы использовали аналогичный метод выбора количества компонентов для, и. Эти варианты были несколько консервативными, но хорошо работали в нашем моделировании и приложении.Тем не менее, пороговое значение следует тщательно настраивать в конкретных приложениях.
Новым аспектом нашего подхода является то, что он позволяет нам оценить относительную изменчивость, объясняемую процессом, специфичным для строки, по сравнению с процессом, специфичным для столбца. Например, в аддитивной модели изменчивость пространства строк может быть определена количественно, тогда как изменчивость пространства столбцов может быть определена количественно. Естественным показателем доли изменчивости, объясняемой процессом, характерным для столбца, является
rT = T∑k = 1SλkUT∑k = 1SλkU + S∑k = 1TλkV = ∑t∑svar {Ui (s)} ∑t∑svar {Ui (s)} + ∑s∑tvar {Vi (t) }.
Точно так же мы можем определить долю изменчивости, объясняемую аддитивным компонентом, по сравнению с мультипликативным компонентом в гибридной модели как
rM = ∑k = 1SλkU2∑k = 1TλkV2T∑k = 1SλkU1 + S∑k = 1TλkV1 + ∑k = 1SλkU2∑k = 1TλkV2 = ∑s∑tvar {U2i (s)} var {V2i (t)} ∑s ∑tvar {U2i (s)} + s∑tvar {V2i (t)} + ∑s∑tvar {U2i (s)} var {V2i (t)}.
4. МОДЕЛИРОВАНИЕ
Чтобы лучше понять эффективность предлагаемого двустороннего PCA на практике, мы проводим имитационные исследования для аддитивной модели (2.1), мультипликативной модели (2.2) и гибридной модели (2.3).
Чтобы сгенерировать смоделированные данные из гибридной модели (2.3), мы используем преобразования Карунена – Лоэва (KLT) (Bosq, 2000) для векторов,, и.
U 1 i = Φ 1 ξ 1 i , V 1 i η =
0
1 i , U 2 i = Φ 2 ξ 2 i , V 20
2 η 2 i .(4.1)
Векторы основных оценок представляют собой случайные векторы с нулевым средним, такие что
E [ξjiξjiT] = diag (λUj); E [ξjiηjiT] = diag (λVj); j∈ {1,2}.
Таким образом, мы можем моделировать данные с помощью
Xi = Ci1S1TT + Φ1ξ1i1TT + 1Sη1iTΨ1T + Φ2ξ2iη2iTΨ2T + Ei,
где « «, — размер выборки. Мы зафиксировали размер, чтобы быть, и данные оцениваются в сетках с,. Количество основных компонентов, используемых для генерации, и указывается как,, и, соответственно.
Мы устанавливаем, для аддитивной модели, для мультипликативной модели и, для гибридной модели фиксировано на 1. Значения фиксированы на, а выбирается для соответствия различным уровням отношения сигнал / шум. . В нашем имитационном эксперименте варьируются два параметра: размер выборки, и отношение сигнал / шум,. Дополнительный материал S.6, доступный на сайте Biostatistics онлайн, предоставляет подробную информацию о конструкции, включая определения собственных векторов. Для каждой настройки параметра мы выполнили 100 повторов.Точность оценки может быть определена количественно среднеквадратической ошибкой, где и — истинные и предполагаемые главные компоненты, а — размер сетки. MSE для гибридной модели кратко изложены в. Подробные результаты моделирования для аддитивных и мультипликативных моделей можно найти в дополнительном материале, доступном на сайте Biostatistics онлайн.
Таблица 1.
Средняя MSE основных компонентов при разном соотношении шум / сигнал для гибридной модели
5.ПРИМЕНЕНИЕ ДАННЫХ
Мы применяем предложенный нами метод к данным ФМРТ исследования термической боли, описанного во Введении. Для простоты мы обсуждаем только результаты гибридной модели.
В наш анализ были включены 20 субъектов, измеряющих более 21 регион мозга, с 45–52 испытаниями на каждого субъекта, каждое из которых состояло из 23 временных точек. 21 регион был идентифицирован в предыдущем исследовании термической боли (Атлас и другие , 2010), поскольку в значительной степени опосредует взаимосвязь между температурой раздражителей и зарегистрированной болью.Эти области обычно классифицируются как принадлежащие к так называемой «матрице боли», описанной Petrovic и другими , 2002, которая представляет собой сеть корковых областей, которые, как считается, вызывают боль в результате ноцицепции. отображает расчетный общий средний сигнал фМРТ и средний сигнал во времени и пространстве. На правой панели общий средний сигнал фМРТ рассчитывается как эмпирическое среднее значение для всех субъектов и всех испытаний. На левой панели показан средний временной сигнал, который представляет собой простое среднее значение во временной области по всем областям мозга и всем испытаниям.Тенденция к росту во временной структуре, вероятно, связана с кумулятивным эффектом тепловой боли, применяемой в начале каждого испытания. На средней панели отображается среднее пространственное значение, которое является средним по всем временным точкам и испытаниям. По сравнению со средним временным значением разброс пространственного среднего относительно невелик.
Расчетные временные, пространственные и общие средние функции для данных фМРТ тепловой боли. Левая панель показывает крайнее среднее временного сигнала. Ось x обозначает ход времени.Средняя панель показывает крайнее среднее пространственного сигнала. На правой панели показано общее среднее значение фМРТ для всех субъектов и всех испытаний. Ось x индексирует временной ход, а ось y индексирует области мозга (дополнительную информацию см. В Таблице S.1).
5.1. Анализ вариаций и PCA
Для временного (зависящего от столбца) члена в аддитивном компоненте первые три собственных значения объясняют и вариацию, соответственно, вместе, над временной изменчивостью в аддитивном компоненте.На верхней правой панели отображаются первые четыре собственных вектора. Первый главный компонент (сплошная черная линия) соответствует активации, связанной с первоначальной реакцией испытуемых на тепловой стимул. Второй главный компонент (пунктирная красная линия) достигает пика между 20 и 24 секундами после начала испытания. Это соответствует первым 4 секундам после окончания приложения тепла и представляет собой реакцию на тепловую стимуляцию. Отсроченный эффект связан с отсроченным характером гемодинамики мозга, который достигает пика примерно через 6 секунд после пика нейрональной активации и согласуется со сроками других экспериментов фМРТ (Lindquist, 2008).Четвертый главный компонент (пунктирная синяя линия) имеет два пика: один в интервале 14–18 с, когда стимул закончился, а другой — в интервале 38–44 с, который непосредственно предшествует сообщению. Таким образом, этот компонент может быть связан с начальной болевой реакцией (первый пик) и воспоминанием о боли (второй пик).
Основные компоненты гибридной модели. На левой панели показаны ПК для отдельных строк или пространственные ПК. На правой панели показаны ПК для конкретных столбцов или временные ПК. Сплошная (черная), пунктирная (красная), пунктирная (зеленая) и пунктирная (синяя) линии обозначают соответственно первую, вторую, третью и четвертую компоненты.Для получения дополнительной информации о местонахождении см. Таблицу S.1 дополнительных материалов, доступных на сайте Biostatistics онлайн.
Пространственный член (специфичный для строки) в аддитивном компоненте имеет еще меньше направлений изменения. Действительно, 99% изменчивости объясняется первыми тремя основными компонентами. Концентрация изменчивости, скорее всего, отражает большую пространственную однородность среди «выбранных» областей мозга. Верхняя левая панель отображает первые три пространственных компонента, где ось x индексирует расположение мозга.Обозначения регионов на рисунке — 1-21, а в таблице S.1 в дополнительном материале S.1, доступном на сайте Biostatistics онлайн, указаны названия этих регионов. Первый главный компонент отрицательно воздействует на области передней островковой части (AINS), дорсальную переднюю поясную извилину (dACC) и мозолистое тело. Это все области, которые, как было показано, опосредуют взаимосвязь между тепловыми раздражителями и болевой реакцией у разных субъектов (Атлас и другие , 2014).Второй главный компонент положительно воздействует на островок, таламус и dACC и отрицательно воздействует на парагиппокампальную извилину (PHG) и нижнюю лобную извилину (IFG). Интересно, что в предыдущих анализах активация в первых регионах показала положительный линейный эффект применяемой температуры, в то время как PHG показал отрицательный эффект (Atlas и другие , 2014). Наконец, третий главный компонент положительно воздействует на IFG, затылочную извилину и мозолистое тело и отрицательно на вторую соматосенсорную область (SII).
На двух нижних панелях мы отображаем главные компоненты, зависящие от строк и столбцов, для мультипликативного компонента. Ведущие основные компоненты очень похожи на компоненты аддитивного компонента.
Доля вариабельности, объясняемая термином, относящимся к столбцу, в аддитивном компоненте, была определена в разделе 3. В исследовании термической боли, которое мы оцениваем, то есть 59% вариабельности данных термической боли связано с временной домен в аддитивной составляющей.Мы также можем вычислить долю изменчивости, объясняемую мультипликативной составляющей,. Это указывает на то, что часть 37% изменчивости происходит из-за взаимодействия более высокого порядка.
Может быть интересно сформулировать статистический тест на значимость каждого члена в гибридной модели. Например, мы можем проверить нулевую гипотезу по сравнению с. Мы использовали параметрический бутстрап, в котором мы подогнали гибридную модель к данным о тепловой боли и сохранили первые три основных компонента, специфичных для строк, и первые шесть компонентов, специфичных для столбцов, в аддитивном компоненте.На основе оцененной модели мы сгенерировали выборки начальной загрузки и извлекли собственные значения и собственные функции. На основе 1000 образцов начальной загрузки мы отклоняем нулевую гипотезу со значением P , равным 0,0012. Мы также выполнили непараметрическую загрузку путем повторной выборки субъектов, что привело к 95% доверительному интервалу для is, который не включает 0.
5.2. Связь между оценкой компонентов и оценкой боли
В этом разделе мы анализируем связь между сигналом фМРТ и оценкой боли.Рассмотрим модель линейной регрессии со смешанным эффектом
Yij = β0 + ∑s∑tβ (s, t) Xij (s, t) + Zijγ + q0i + ∑s∑tqi (s, t) Xij (s, t) + Zijai + εij
(5.1)
или в матричной записи,
Y i j = β 0 + vec ( B ) T vec ( X i Z) i j γ + q 0 i + vec ( Q i ) T vec (03 X
) + i j a i + ε i j ,
(5.2)
где — логарифм боли для испытуемого в испытании, — показатель применяемой температуры и (или — сигнал фМРТ для испытуемого). Поскольку мы можем аппроксимировать KLT, как в разделе 4, (5.2) принимает вид
Yij = β0 + vec (B) Tvec (Ci1S1TT + Φ1ξ1i1TT + 1Sη1iTΨ1T + Φ2ξ2iη2iTΨ2T) + Zijγ + q0i + vec (Qi) Tvec (Ci1S1TT + Φξ1ξTi) Tvec (Ci1S1TT + Φξ1ξ1 + 1 TCi + vec (Φ1TB1T) Tξ1i + vec (1STBΨ1) Tη1i + vec (Φ2TBΨ2) Tvec (ξ2iη2iT) + Zijγ + q0i + vec (1STQi1T) TCi + vec (Φ1TQi1Tc (1STQi1T) TCi + vec (Φ1TQi1T) Tξ1STi (Φ1TQi1T) Tξ1STi + (Φ1TQi1T) Tξ1STi + (ξ2iη2iT) + Zijai + εijYij ≜β0 + βCCi + β1Tξ1i + β2Tη1i + vec (B3) Tvec (ξ2iη2iT) + Zijγ + q0i + qCiCi + q1iTξ1i + q2iTη1iξ2 + vec
Это LMM с оценками ПК в качестве ковариатов, где,,,,,,, и — новые коэффициенты.
Мы подобрали несколько моделей с разными случайными эффектами, а результаты суммированы в. Модель 1 — это линейная модель без случайного эффекта. Модель 2 — это модель со смешанными эффектами только со случайным пересечением. Модель 3 имеет как случайный перехват, так и случайный эффект оценок. Все три модели показывают, что (i) температура имеет сильную положительную связь с рейтингом боли; (ii) баллы второго и четвертого основных компонентов положительно связаны с рейтингом боли.
Таблица 2.
Коэффициенты фиксированных эффектов для трех моделей смешанных эффектов, которые регрессируют баллы PCA по баллам рейтинга боли
Положительная корреляция между температурой и оценкой боли интуитивно понятна. При высокой температуре (например, TempSetting = 1) испытуемые чаще сообщают о более высоких показателях боли. Второй главный компонент представляет собой гемодинамический ответ на весь тепловой стимул. Положительный коэффициент указывает на то, что люди, испытывающие сильную боль, как правило, имеют более высокую интенсивность фМРТ в ответ на стимул.Четвертый главный компонент может представлять процесс воспоминания о боли. Повышенная активация в это время, как правило, соответствует более сильному сообщению о боли. Интересно, что знак пространственных оценок соответствует тем, которые наблюдаются в неврологических сигнатурах, ранее использовавшихся для прогнозирования физической боли в результате активации мозга (Wager и другие , 2013).
Случайные эффекты в моделях 2 и 3 проверены. В Модели 2 оценочное стандартное отклонение для случайного пересечения составляет 0,14 (в то время как стандартное отклонение для невязки равно 0.32), что статистически значимо при уровне значимости 0,05. В Модели 3 оценочное стандартное отклонение для случайного пересечения составляет 0,14 (в то время как стандартное отклонение для остатка составляет 0,32), что является статистически значимым. Расчетное стандартное отклонение для случайного наклона составляет 0,04, что не является статистически значимым.
Модель (5.1) также может быть расширена до нелинейной модели путем включения полиномиальных членов или проецирования в сплайн или базис Фурье.
6.ОБСУЖДЕНИЕ
В этой статье представлены три типа разделимых двусторонних матрично-переменных моделей, использующих явное моделирование скрытых процессов. Введены условия идентифицируемости и даны оценки метода моментов для ковариационных матриц всех скрытых процессов. Затем PCA используется для уменьшения размерности на уровне отдельных пространственных и временных процессов. Методы применяются к данным, наблюдаемым с белым шумом или без него. Когда мы применили этот метод к данным из исследования фМРТ, мы выделили различные закономерности, присущие данным, и количественно оценили степень вариабельности, зафиксированную различными компонентами.
Модели, которые мы здесь предложили, предназначены в основном для исследовательских целей. Другими словами, качество подгонки моделей не является нашей главной задачей. Однако мы показали, что формальные тесты начальной загрузки могут использоваться для проверки того, являются ли различные компоненты разделяемой модели статистически значимыми. Чтобы проверить, является ли модель отделимой по сравнению с неотделимой альтернативой, мы могли бы использовать идеи из работы Лу и Циммермана (2005), используя разницу в логарифмических детерминантах ковариационных матриц при предположениях отделимости и неотделимости.Тест отклонил гипотезу о том, что разделимой гибридной модели было достаточно, чтобы объяснить наблюдаемую изменчивость данных. Однако предположение об отделимости позволило нам получить значимые и интерпретируемые результаты. Наше внимание было сосредоточено на исследовательском анализе данных. Мы не будем недооценивать полезность предложенного метода, потому что он смог идентифицировать полезные направления изменения, которые связаны с внешними стимулами. Гибридная модель отделимости может быть расширена до модели типа, где процессы и не коррелированы и является заданной функцией.Например, гибридная модель может быть получена с помощью, и. Вопрос о том, будут ли полезны более сложные функции, остается открытым, хотя мы считаем, что явное определение разделимости весьма полезно.
Помимо вышеуказанного обобщения моделей, наши подходы также предлагают несколько других направлений будущих исследований. Во-первых, нельзя гарантировать, что оцененная ковариационная матрица будет положительно определенной, когда количество субъектов меньше максимального из измерений пространства и времени.Одним из возможных решений является работа над некоторой подмоделью предлагаемых разделяемых моделей. Например, Фосдик и Хофф (2014) разложили ковариационную матрицу на сумму матрицы пониженного ранга и диагональной матрицы, а затем аппроксимировали матрицу пониженного ранга факторной моделью с использованием MLE. Во-вторых, бесшумная версия нашего метода оценок моментов аналогична двунаправленному 2D PCA (Zhang and Zhou, 2005), который может страдать от шумового загрязнения. Мы могли бы решить эту проблему с помощью техники недиагонального сглаживания, упомянутой в разделе 3.Другой альтернативой является рассмотрение мультилинейной оценки, описанной в Hung и других (2012), путем итеративной оценки методом альтернативных наименьших квадратов. В-третьих, мы не учли многоуровневую структуру данных. Чтобы решить эту проблему, мы можем реализовать технику декомпозиции, предложенную Shou и другими (2015), до разделения пространственно-временных вариаций. В-четвертых, мы могли бы разработать строгий подход к шуму (Di и др. , 2009 г.), а также рассмотреть возможную разреженность функциональных наблюдений (Di и др. , 2014 г.).Наконец, следует разработать структуру проверки гипотез для разделяемых моделей. Тест отношения правдоподобия может быть предложен, если мы наложим больше предположений в модели (Лу и Циммерман, 2005). Однако, даже если модели не работают, они все равно могут быть полезны в качестве приближения для исследовательских целей.
БЛАГОДАРНОСТИ
Конфликт интересов: Не объявлен.
ФИНАНСИРОВАНИЕ
Эта работа частично поддержана грантом 1R01MH095836 Национального института здравоохранения.
ССЫЛКИ
- Акаике, Х. (1974). Новый взгляд на идентификацию статистической модели. IEEE Transactions по автоматическому контролю 19 (6), 716–723. [Google Scholar]
- Аллен Г. И., Гросеник Л. и Тейлор Дж. (2014). Разложение матрицы обобщенных наименьших квадратов. Журнал Американской статистической ассоциации 109, 145–159. [Google Scholar]
- Атлас, Л. И, Болджер, Н., Линдквист, М. А. и Вейджер, Т. Д. (2010). Мозговые медиаторы прогнозирующего воздействия сигналов на воспринимаемую боль.Журнал неврологии 30 (39), 12964–12977. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Атлас, Л. И, Линдквист, М. А., Болджер, Н. и Вейджер, Т. Д. (2014). Мозговые медиаторы воздействия ядовитого тепла на боль. Боль 155, 1632–1648. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Боск, Д. (2000). Линейные процессы в функциональных пространствах: Теория и приложения. Нью-Йорк: Springer-Verlag. [Google Scholar]
- Каффо, Б.С., Крайничану, К.М., Вердуско, Г., Джоэл, С., Мостофски, С. Х., Бассет, С. С. и Пекар, Дж. Дж. (2010) .. Двухэтапная декомпозиция для анализа функциональной связи для фМРТ с приложением к риску болезни Альцгеймера. Нейроизображение 51 (3), 1140–1149. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Калхун, В. Д., Адали, Т., Перлсон, Г. Д. и Пекар, Дж. Дж. (2001). Метод групповых выводов из функциональных данных МРТ с использованием независимого компонентного анализа. Картирование человеческого мозга 14 (3), 140–151. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Крайничану, К.М., Каффо, Б.С., Луо, С. и Зипунников, В. (2011). Декомпозиция значений совокупности, основа для анализа популяций изображений. Журнал Американской статистической ассоциации 106, 775–790. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Ди, Ч.-З., Крайничану, Ч.М., Каффо, Б.С. и Пенджаби, Н.М. (2009). Многоуровневый функциональный анализ главных компонент. Анналы прикладной статистики 3 (1), 458–488. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Ди, Ч.-З., Янк, В.С. и Крайничану, К. М. (2014). Многоуровневый разреженный функциональный анализ главных компонент. СТАТИСТИКА 3 (1), 126–143. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Дин Дж., Спенсер К. М. и Дончин Э. (2003). Локализация потенциальной реакции новизны, связанной с событием, как определено анализом основных компонентов. Когнитивные исследования мозга 17 (3), 637–650. [PubMed] [Google Scholar]
- Фосдик, Б.К. и Хофф, П.Д .. (2014). Раздельный факторный анализ с приложениями к данным о смертности.Анналы прикладной статистики 8 (1), 120–147. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Гревен, С., Крайничану, К., Каффо, Б. и Райх, Д. (2010). Продольный функциональный анализ главных компонентов. Электронный статистический журнал 4, 1022. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Хюттель, С. А., Сонг, А. В. и Маккарти, Г. (2004). Функциональная магнитно-резонансная томография, том 1, Сандерленд, Массачусетс: Sinauer Associates. [Google Scholar]
- Хунг, Х., Ву, П., Ипин, Т. и Суюн, Х .. (2012). О полилинейном анализе главных компонент тензоров второго порядка. Биометрика 99 (3), 569–583. [Google Scholar]
- Хювяринен, А. и Оя, Э .. (2000). Независимый компонентный анализ: алгоритмы и приложения. Нейронные сети 13 (4), 411–430. [PubMed] [Google Scholar]
- Джоллифф, И. (2002). Анализ главных компонентов Нью-Йорк: Springer. [Google Scholar]
- Линдквист, М.А. (2008). Статистический анализ данных фМРТ.Статистическая наука 23 (4), 439–464. [Google Scholar]
- Линдквист, М.А. (2012). Функциональный анализ причинно-следственной связи с приложением к подключению мозга. Журнал Американской статистической ассоциации 107, 1297–1309. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Лу Н. и Циммерман Д. Л. (2005). Тест отношения правдоподобия для разделимой ковариационной матрицы. Письма о статистике и вероятности 73 (4), 449–457. [Google Scholar]
- Петрович, П., Кальсо, Э., Петерссон, К. М. и Ингвар, М. (2002). Плацебо и опиоидная анальгезия — визуализация общей нейрональной сети. Наука 295 (5560), 1737–1740. [PubMed] [Google Scholar]
- Райс, Дж. А. и Сильверман, Б. В. (1991). Непараметрическая оценка среднего и ковариационной структуры, когда данные представляют собой кривые. Журнал Королевского статистического общества. Серия B 53 (1), 233–243. [Google Scholar]
- Шоу Х., Зипунников В., Крайничану Ч. М. и Гревен С. (2015). Структурированный функциональный анализ главных компонентов.Биометрия 71 (1), 247–257. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Смилде, А. К., Янсен, Дж. Дж., Хефслот, Х. К. Дж., Ламерс, Р.-Дж. А. Н., Ван Дер Греф, Дж. И Тиммерман, М. Э .. (2005). Anova-одновременный компонентный анализ (ASCA): новый инструмент для анализа разработанных данных метаболомики. Биоинформатика 21 год (13), 3043–3048. [PubMed] [Google Scholar]
- Спенсер, К. М., Дин, Дж. И Дончин, Э .. (2001). Пространственно-временной анализ поздних ответов ERP на девиантные стимулы.Психофизиология 38 (2), 343–358. [PubMed] [Google Scholar]
- Станисвалис, Дж. Г. и Ли, Дж. Дж. (1998). Непараметрический регрессионный анализ продольных данных. Журнал Американской статистической ассоциации 93, 1403–1418. [Google Scholar]
- Ван Лоан, К. и Пицианис, Н. (1992). Аппроксимация произведениями Кронекера. Технический отчет, Корнельский университет. [Google Scholar]
- Вивиани Р., Грон Г. и Спитцер М. (2005). Функциональный анализ главных компонентов данных фМРТ.Картирование человеческого мозга 24 (2), 109–129. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Уэйджер, Т.Д., Атлас, Л.И, Линдквист, М.А., Рой, М., Ву, К.-В. и Кросс, Э .. (2013). Неврологический признак физической боли на основе фМРТ. Медицинский журнал Новой Англии 368 (15), 1388–1397. [Бесплатная статья PMC] [PubMed] [Google Scholar]
- Сяо, Л., Ли, Ю. и Рупперт, Д. (2013). Быстрые двумерные P-шлицы: более гладкий сэндвич. Журнал Королевского статистического общества: серия B 75 (3), 577–599.[Google Scholar]
- Яо, Ф., Мюллер, Х.Г. и Ван, Дж. Л. .. (2005). Функциональный анализ данных для разреженных продольных данных. Журнал Американской статистической ассоциации 100 (470), 577–590. [Google Scholar]
- Чжан, Д. и Чжоу, З.-Х .. (2005). (2d) 2PCA: Двунаправленный двумерный PCA для эффективного представления и распознавания лиц. Нейрокомпьютинг 69 (1), 224–231. [Google Scholar]
(PDF) Интеграция преобразования данных в анализ основных компонентов
Dempster, A.П., Лэрд, Н. М., Рубин, Д. Б. (1977), «Максимальное правдоподобие неполных данных
с помощью алгоритма ЭМ», Журнал Королевского статистического общества. Series B (Methodolog-
ical), 39, стр. 1–38.
Голуб Г. и Ван Лоан К. (2013), Матричные вычисления, Исследования Джона Хопкинса в области математики
ematical Sciences, Johns Hopkins University Press, 4-е изд.
Hastie, T., Tibshirani, R., Sherlock, G., Eisen, M., Brown, P., and Botstein, D. (1999), «Imput-
, недостающие данные для массивов экспрессии генов», Tech.представитель Стэнфордского статистического управления.
Хигучи И. и Эгути С. (2004), «Робастный анализ главных компонентов с адаптивной селекцией
для настройки параметров», J. Mach. Учиться. Res., 5, 453–471.
Хотеллинг, Х. (1933), «Анализ комплекса статистических переменных с основным составом
единиц», Journal of Educational Psychology, 24, 498–520.
Ху, Дж., Райт, Ф.А., и Цзоу, Ф. (2006), «Оценка индексов экспрессии для массивов олигонуклеотидов
с использованием разложения по сингулярным значениям», Журнал Американской статистической ассоциации —
ciation, 101, 41–50.
Хуанг, Дж. З., Шен, Х. и Буя, А. (2008), «Анализ основных функциональных компонентов с помощью
приближения первого ранга со штрафными санкциями», Электронный статистический журнал 2008 г., том. 2, 678-695.
Hubert, M., Rousseeuw, P., and Verdonck, T. (2009), «Надежный PCA для искаженных данных и его карта выбросов
», Computational Statistics & Data Analysis, 53, 2264 — 2274, Четвертый специальный
Выпуск по вычислительной эконометрике.
Hubert, M., Rousseeuw, P.Дж. И Вербовен С. (2002), «Быстрый метод для надежных основных компонентов
с приложениями к хемометрии», Хемометрия и интеллектуальная лаборатория
Системы, 60, 101 — 111.
Хантер, Д. Р. и Ланге, К. (2004), «Учебное пособие по алгоритмам ММ», The American Statisti-
cian, 58.
Джоллие, ИТ (2002), Анализ главных компонентов, Springer, 2-е изд.
Локанторе, Н., Маррон, Дж., Симпсон, Д., Триполи, Н., Чжан, Дж., Коэн, К., Бенте, Г., Fraiman,
R., Brumback, B., Croux, C., Fan, J., Kneip, A., Marden, J., and P, D. (1999), «Надежный
24
X -Ray Классификация изображений: легкий путь | by Amanda Woo
Набор данных — это набор данных. Это очень важная часть, которую нужно сделать правильно, поскольку она служит фундаментом, на котором будет построена ваша модель. Если этого нет в данных, модель не узнает то, чего она не знает. Для обучения модели машинного обучения необходим высококачественный набор данных, поскольку данные определяют поведение и производительность модели.
Данные определяют модель.
Наличие большого количества данных само по себе не означает наличие высококачественного набора данных. Все сводится к наличию «правильных данных». Это означает, что данные должны:
- Отражать реальные примеры
- Захватить все примеры вариаций / сценариев, с которыми может столкнуться модель — обычных, редких и всего промежуточного.
- Будьте разнообразны в своих примерах (например, не делайте просто фотографии собак со снегом на заднем плане, потому что модель, вероятно, будет связывать снежный фон с собаками, но на самом деле мы хотим, чтобы модель обнаруживала собак, а не снег)
- Будьте сбалансированы — Если у нас будет больше примеров одного класса / категории, чем другого, обученная модель будет работать плохо.
- Регулярно обновляйте по мере появления новых примеров или вариаций, чтобы модель знала и о них.
Data Fitting
Нам также необходимо убедиться, что набор данных охватывает все необходимые сценарии использования. Отсутствие достаточного количества вариантов использования, скорее всего, приведет к плохо обученной модели. Вопросы, которые следует задать себе при создании набора данных:
- Сколько данных мне нужно?
- Какие данные мне нужны?
- Достаточно ли различий в наборе данных, чтобы охватить все примеры?
- Точно и полностью ли данные отражают все соответствующие варианты использования?
Возвращаясь к нашему примеру набора данных детских рентгеновских изображений, он должен содержать следующее:
- Сбалансированное количество рентгеновских снимков для каждого возраста ребенка (с симптомами пневмонии и без них)
- Сбалансированное число рентгеновских снимков с различным диапазоном времени воздействия (с симптомами пневмонии и без)
- Рентгеновские снимки, содержащие другой диагноз, который можно спутать с пневмонией
Помимо разнообразных наборов данных с хорошим разбросом положительных результатов и отрицательные примеры, нам также необходимо иметь ярлыки, связанные с каждым из примеров.Если набор данных еще не помечен, его необходимо пометить, прежде чем его можно будет использовать в качестве входных данных для построения модели. Вы можете либо пометить набор данных самостоятельно, либо заплатить за это.
«В современном искусственном интеллекте правила данных. А.И. Программное обеспечение настолько умно, насколько данные, используемые для его обучения. Если в системе будет намного больше белых мужчин, чем чернокожих женщин, то чернокожих женщин будет хуже идентифицировать ». — New York Times
Обязательно следите за несбалансированными наборами данных — они могут внести нежелательную систематическую ошибку в вашу модель.Несбалансированный набор данных — это тот, в котором одна или несколько меток содержат значительно больше или меньше примеров, чем другие метки. После того, как вы пометили свой набор данных, проверьте количество примеров, связанных с каждой из меток, чтобы убедиться, что каждая метка содержит одинаковое количество примеров. Если вы видите, что у одного лейбла есть только несколько примеров, а у других — около дюжины, вы, скорее всего, заметите некоторую предвзятость при использовании модели в реальном мире. Когда вы будете довольны охватом набора данных, пора построить модель.
Модель может быть построена двумя способами: (1) автоматизированное машинное обучение и (2) пользовательское моделирование. «Автоматизированное машинное обучение» — это платная услуга, которая означает, что ее легко начать и дешево для быстрой разработки или создания прототипа модели. Однако его сложно расширить, и поставщику доступны конфиденциальные данные. С другой стороны, «пользовательское моделирование» полностью настраивается для неограниченного количества случаев использования, и есть полный контроль над параметрами для настройки модели. Но обратная сторона медали — это дорогое удовольствие и требует опыта в машинном обучении.Автоматизированные онлайн-сервисы машинного обучения, такие как Google Cloud и IBD Watson, позволяют любому быстро создавать модели, просто предоставляя высококачественный маркированный набор данных.
Прежде чем мы начнем строить нашу модель, важно определить бизнес-цели и результаты, которые мы ожидаем от этой модели. Также подумайте об уровне производительности, который вы хотите, чтобы ваша модель имела. В качестве отправной точки мы можем использовать производительность человека при выполнении этой задачи. Если модель может делать это лучше, чем люди, то я бы сказал, что модель находится в приличном состоянии.А теперь давайте построим модель.
1. Обучите модель
Как упоминалось ранее, данные определяют поведение и производительность модели, включая ее эффективность и точность. Таким образом, плохие данные приведут к плохой модели. Например, если вы скармливаете модели изображение, которое не было представлено в обучающих данных, оно не будет правильно отнесено к категории.
В нашем примере с X-Ray мы будем использовать Google Cloud AutoML Vision для обучения модели. Мы будем использовать уже подготовленный набор данных из Kaggle [2].Для начала загрузите помеченный набор данных, нажав «New Dataset»:
1.0 Найдите кнопку «New Dataset» в пунктирном синем кругеПосле загрузки данных ваш экран должен выглядеть примерно так:
1.1 Набор данных успешно загруженоДалее мы собираемся обучить модель с этим набором данных, перейдя на вкладку «Поезд» и нажав «Обучить модель».
1.2 Найдите кнопку «Обучить модель» на вкладке «Поезд».Обратите внимание, что этот набор данных будет автоматически разделен для обучения, тестирования и проверки модели, поскольку данные, используемые для обучения модели, никогда не должны использоваться для тестирования или проверки модели.
По завершении обучения модели нам нужно понять, «насколько хороша» эта модель. Мы более подробно рассмотрим способы анализа результатов модели, иначе выводит .
2. Оцените модель
Чтобы понять качество нашей модели, нам необходимо измерить ее производительность. Для этого часто используются следующие показатели:
- Точность — это процент правильных прогнозов от общего числа прогнозов.
- Напомнить — это процент правильных прогнозов от общего числа фактических экземпляров (также известных как истинные метки, наземные истинные положительные результаты).
- F1 Score — это средневзвешенное значение точности и отзыва; при этом учитываются как ложные срабатывания, так и ложноотрицательные. Обратите внимание, что оценка F1 также может быть рассчитана из приведенной ниже матрицы неточностей.
- Матрица путаницы предназначена для описания характеристик модели, в частности, с выделением того, где модель является правильной (синий цвет) и / или неисправной (оранжевый цвет).
Возвращаясь к тому месту, где мы остановились при обучении модели с помощью AutoML Vision, перейдите на вкладку «Оценить» набора данных, чтобы проверить производительность модели. Это должно выглядеть примерно так:
2.3 Оценка моделиЕсли вы прокрутите вниз, вы увидите больше метрик (например, матрицу путаницы), а также сможете увидеть показатели производительности для конкретной метки.
Не бывает такой вещи, как однократное обучение модели и получение «идеальной модели».Это итеративный процесс. Так что в случае, если вы не удовлетворены результатами, у вас есть два варианта: 1) улучшить данные и 2) реализовать собственную модель. Я настоятельно рекомендую вам сначала взглянуть на улучшение данных, а если вы не сможете добиться лучших результатов, только потом подумайте о реализации своей собственной модели. На этом этапе вы лучше поймете, почему ваша модель не соответствует ожиданиям. Несмотря на это, есть вероятность, что модель, предоставленная AutoML, приведет вас к достойной точке при наличии высококачественного набора данных.
3. Прогнозы модели
Наконец, давайте посмотрим, как модель работает с новыми изображениями. Перейдите на вкладку «Прогноз» и загрузите изображение, которое не использовалось в наборе данных для обучения / тестирования.
3.0 Найдите кнопку «Загрузить изображения» на вкладке «Прогноз»После того, как прогноз будет сделан, ваш экран должен выглядеть примерно так:
3.1 Прогноз модели на новом рентгеновском снимке ребенкаПоздравляем, вы только что построил свою первую модель!
[PCA] Практическое руководство по анализу основных компонентов в R & Python
Введение
Слишком много чего-либо ни на что не годится!
Что произойдет, если в наборе данных слишком много переменных? Вот несколько возможных ситуаций, с которыми вы можете столкнуться:
- Вы обнаружите, что большинство переменных коррелированы.
- Вы теряете терпение и решаете запустить модель на всех данных. Это возвращает плохую точность, и вы чувствуете себя ужасно.
- Вы не решаете, что делать
- Вы начинаете придумывать какой-нибудь стратегический метод, чтобы найти несколько важных переменных
Поверьте мне, справляться с такими ситуациями не так сложно, как кажется. Статистические методы, такие как факторный анализ, анализ главных компонент, помогают преодолеть такие трудности.
В этом посте я подробно объяснил концепцию анализа главных компонентов.Я постарался сделать объяснение простым и информативным. Для практического понимания я также продемонстрировал использование этой техники в R с интерпретациями.
Примечание. Для понимания этой концепции необходимы предварительные знания статистики.
Обновление (по состоянию на 28 июля): ниже добавлен процесс прогнозного моделирования с использованием компонентов PCA в R.
Что такое анализ главных компонентов?
Проще говоря, анализ главных компонентов — это метод извлечения важных переменных (в форме компонентов) из большого набора переменных, доступных в наборе данных.Он извлекает низкоразмерный набор функций из высокомерного набора данных с целью собрать как можно больше информации. С меньшим количеством переменных визуализация также становится более значимой. PCA более полезен при работе с трехмерными данными и выше.
Всегда выполняется на основе симметричной корреляционной или ковариационной матрицы. Это означает, что матрица должна быть числовой и содержать стандартизованные данные.
Давайте разберемся с этим на примере:
Допустим, у нас есть набор данных размером 300 ( n ) × 50 ( p ). n представляет количество наблюдений, а p представляет количество предикторов. Поскольку у нас большое p = 50, может быть p (p-1) / 2
графиков разброса, то есть более 1000 графиков, возможных для анализа взаимосвязи переменных. Разве не будет утомительной работой провести исследовательский анализ этих данных?
В этом случае было бы ясным подходом выбрать подмножество предиктора p (p << 50) , которое захватывает как можно больше информации.Затем следует нанесение наблюдения в результирующее низкоразмерное пространство.
На изображении ниже показано преобразование данных высокой размерности (3 измерения) в данные низкой размерности (2 измерения) с помощью PCA. Не забывайте, что каждое результирующее измерение представляет собой линейную комбинацию из p функций
Источник: nlpca
Каковы основные компоненты?
Главный компонент — это нормализованная линейная комбинация исходных предикторов в наборе данных.На изображении выше PC1 и PC2 являются основными компонентами. Допустим, у нас есть набор предикторов как X¹, X² ..., Xp
Главный компонент можно записать как:
Z¹ = Φ¹¹X¹ + Φ²¹X² + Φ³¹X³ + .... +
Φp ¹Xp
, где
- Z¹ — первая главная составляющая.
-
Φp¹
— вектор нагрузки, состоящий из нагрузок (Φ¹, Φ² ..
) первой главной составляющей. Нагрузки ограничены суммой квадрата, равной 1.Это связано с тем, что большая величина нагрузок может привести к большим отклонениям. Он также определяет направление главного компонента (Z¹), по которому данные изменяются больше всего. В результате получается линия в мерном пространстве p , которая наиболее близка к наблюдениям n . Близость измеряется с использованием среднего квадрата евклидова расстояния. -
X¹..Xp
— нормализованные предикторы. Нормализованные предикторы имеют среднее значение, равное нулю, и стандартное отклонение, равное единице.
Следовательно,
Первый главный компонент представляет собой линейную комбинацию исходных переменных-предикторов, которая фиксирует максимальную дисперсию в наборе данных.Он определяет направление наибольшей изменчивости данных. Чем больше вариативность, зафиксированная в первом компоненте, тем больше информации, полученной компонентом. Никакой другой компонент не может иметь вариабельность выше, чем первый главный компонент.
Первый главный компонент приводит к строке, которая наиболее близка к данным, то есть минимизирует сумму квадратов расстояния между точкой данных и линией.
Точно так же мы можем вычислить и вторую главную компоненту.
Второй главный компонент ( Z²
) также представляет собой линейную комбинацию исходных предикторов, которая фиксирует оставшуюся дисперсию в наборе данных и не коррелирует с Z¹
.Другими словами, корреляция между первым и вторым компонентами должна быть нулевой. Его можно представить как:
Z² = Φ¹²X¹ + Φ²²X² + Φ³²X³ + .... + Φp2
Xp
Если два компонента не коррелированы, их направления должны быть ортогональными (изображение ниже). Это изображение основано на смоделированных данных с двумя предикторами. Обратите внимание на направление компонентов, как и ожидалось, они ортогональны. Это говорит о том, что корреляция ч / б этих компонентов равна нулю.
Все последующие главные компоненты следуют аналогичной концепции i.е. они фиксируют оставшуюся вариацию без корреляции с предыдущим компонентом. В общем, для размерных данных n × p можно построить главный компонент min ( n-1, p) .
Направления этих компонентов идентифицируются неконтролируемым образом, т.е. переменная отклика (Y) не используется для определения направления компонентов. Следовательно, это неконтролируемый подход.
Примечание. Метод методом наименьших квадратов (PLS) — это контролируемая альтернатива PCA.PLS присваивает более высокий вес переменным, которые сильно связаны с переменной ответа, чтобы определить основные компоненты.
Почему необходима нормализация переменных?
Основные компоненты поставляются с нормализованной версией исходных предикторов. Это потому, что исходные предикторы могут иметь разные масштабы. Например: представьте себе набор данных с единицами измерения переменных, такими как галлоны, километры, световые годы и т. Д. Несомненно, что масштаб отклонений этих переменных будет большим.
Выполнение PCA для ненормализованных переменных приведет к безумно большим нагрузкам для переменных с высокой дисперсией. В свою очередь, это приведет к зависимости главного компонента от переменной с высокой дисперсией. Это нежелательно.
Как показано на изображении ниже, PCA запускался для набора данных дважды (с немасштабированными и масштабированными предикторами). Этот набор данных содержит ~ 40 переменных. Как видите, в первом основном компоненте преобладает переменная Item_MRP. А во втором основном компоненте преобладает переменная Item_Weight.Это доминирование преобладает из-за высокого значения дисперсии, связанной с переменной. Когда переменные масштабируются, мы получаем гораздо лучшее представление переменных в 2D-пространстве.
Внедрить PCA в R & Python (с интерпретацией)
Сколько основных компонентов выбрать? Я мог бы глубоко погрузиться в теорию, но лучше было бы ответить на эти вопросы практически.
Для этой демонстрации я буду использовать набор данных из Big Mart Prediction Challenge III.
Помните, что PCA может применяться только к числовым данным. Следовательно, если данные содержат категориальные переменные, их необходимо преобразовать в числовые. Кроме того, убедитесь, что вы выполнили базовую очистку данных перед применением этого метода. Давайте быстро закончим с начальными этапами загрузки и очистки данных:
# путь к каталогу
> путь <- "... / Data / Big_Mart_Sales"
#set рабочий каталог
> setwd (путь)
# загрузить поезд и тестовый файл
> поезд <- прочитать.csv ("train_Big.csv")
> test <- read.csv ("test_Big.csv")
# добавить столбец
> test $ Item_Outlet_Sales <- 1
# набор данных
> combi <- rbind (train, test)
#impute пропущенных значений с медианой
> combi $ Item_Weight [is.na (combi $ Item_Weight)] <- median (combi $ Item_Weight, na.rm = TRUE)
#impute 0 со средним значением
> combi $ Item_Visibility <- ifelse (combi $ Item_Visibility == 0, медиана (combi $ Item_Visibility), combi $ Item_Visibility)
mode и impute
> таблица (combi $ Outlet_Size, combi $ Outlet_Type)
> уровни (combi $ Outlet_Size) [1] <- "Other"
До сих пор мы вменяли пропущенные значения.Теперь нам осталось удалить зависимую (ответную) переменную и другие переменные-идентификаторы (если есть). Как мы уже говорили выше, мы практикуем метод обучения без учителя, поэтому переменную ответа необходимо удалить.
# удалить зависимые переменные и переменные идентификатора
> my_data <- subset (combi, select = -c (Item_Outlet_Sales, Item_Identifier, Outlet_Identifier))
Давайте проверим доступные переменные (a.k.a предикторы) в наборе данных.
# проверить доступные переменные
> colnames (my_data)
Поскольку PCA работает с числовыми переменными, давайте посмотрим, есть ли у нас какие-либо другие переменные, кроме числовых.
#check variable class
> str (my_data)
'data.frame': 14204 obs. из 9 переменных:
$ Item_Weight: num 9,3 5,92 17,5 19,2 8,93 ...
$ Item_Fat_Content: коэффициент с 5 уровнями "LF", "low fat" ,..: 3 5 3 5 3 5 5 3 5 5 ...
$ Item_Visibility: число 0,016 0,0193 0,0168 0,054 0,054 ...
$ Item_Type: Фактор с 16 уровнями «Выпечка», ..: 5 15 11 7 10 1 14 14 6 6 ...
$ Item_MRP: число 249,8 48,3 141,6 182,1 53,9 ...
$ Outlet_Establishment_Year: int 1999 2009 1999 1998 1987 2009 1987 1985 2002 2007 ...
$ Outlet_Size: множитель с 4 уровнями "Другой", "Высокий", ..: 3 3 3 1 2 3 2 3 1 1 ...
$ Outlet_Location_Type: Фактор с 3 уровнями "Уровень 1", "Уровень" 2 ",..: 1 3 1 3 3 3 3 3 2 2 ...
$ Outlet_Type: Фактор с 4 уровнями "Продуктовый магазин", ..: 2 3 2 1 2 3 2 4 2 2 ...
К сожалению, 6 из 9 переменных имеют категориальный характер. У нас есть дополнительная работа. Мы преобразуем эти категориальные переменные в числовые, используя одну горячую кодировку.
# загрузить библиотеку
> library (dummies)
# создать фиктивный фрейм данных
> new_my_data <- dummy.data.frame (my_data, names = c («Item_Fat_Content», «Item_Type»,
«Outlet_Establishment_Year», «Outlet_Size»,
«Outlet_Location_Type», «Outlet_Type», если у we0003 теперь есть проверка))
# проверить набор данных
> str (new_my_data)
И теперь у нас есть все числовые значения. Разделим данные на тестовые и обучающие.
#divide the new data
> pca.train <- new_my_data [1: nrow (train),]
> pca.test <- new_my_data [- (1: nrow (train)),]
Теперь мы можем продолжить PCA.
Базовая функция R prcomp () используется для выполнения PCA. По умолчанию он центрирует переменную так, чтобы среднее значение было равно нулю. Со шкалой параметра . = T
, мы нормализуем переменные так, чтобы стандартное отклонение было равно 1.
#principal component analysis
> prin_comp <- prcomp (pca.поезд, масштаб. = T)
> names (prin_comp)
[1] "sdev" "вращение" "center" "scale" "x"
Функция prcomp () приводит к 5 полезным измерениям:
1. center и scale относится к соответствующему среднему значению и стандартному отклонению переменных, которые используются для нормализации до реализации PCA
# выводит среднее значение переменных
prin_comp $ center
# выводит стандартное отклонение переменных
prin_comp $ scale
2.Мера вращения обеспечивает загрузку главного компонента. Каждый столбец матрицы вращения содержит вектор нагрузки главного компонента. Это наиболее важная мера, которая нас должна интересовать.
> prin_comp $ Rotation
Это возвращает 44 загрузки основных компонентов. Это верно ? Абсолютно. В наборе данных максимальное количество загрузок основных компонентов составляет минимум (n-1, p). Давайте посмотрим на первые 4 основных компонента и первые 5 строк.
-0,016789483 > prin_comp $ вращение [1: 5,1: 4]
PC1 PC2 PC3 PC4
Item_Weight 0.0054429225 -0,001285666 0,011246194 0,011887106
Item_Fat_ContentLF -0,0021983314 0,003768557 -0,0097
Item_Fat_Contentlow жир -0,00110 0,001866905 -0,003066415 -0,018396143
Item_Fat_ContentLow Жир 0,0027936467 -0,002234328 0,028309811 0,056822747
Item_Fat_Contentreg 0,0002936319 0,001120931 0,0054 -0,001026615
3. Чтобы вычислить вектор оценки главного компонента, нам не нужно умножать нагрузку на данные.Скорее, матрица x имеет векторы оценок главных компонентов в измерении 8523 × 44.
> dim (prin_comp $ x)
[1] 8523 44
Давайте изобразим полученные главные компоненты.
> biplot (prin_comp, scale = 0)
Параметр scale = 0
обеспечивает масштабирование стрелок для представления нагрузок. 2
первых 10 компонентов
> пр_вар [1:10]
[1] 4.563615 3,217702 2,744726 2,541091 2,198152 2,015320 1,932076 1,256831
[9] 1.203791 1,168101
Мы стремимся найти компоненты, которые объясняют максимальную дисперсию. Это потому, что мы хотим сохранить как можно больше информации с помощью этих компонентов. Таким образом, чем выше объясненная дисперсия, тем выше будет информация, содержащаяся в этих компонентах.
Чтобы вычислить долю дисперсии, объясняемую каждым компонентом, мы просто делим дисперсию на сумму общей дисперсии.Это приводит к:
0,02468313 0,02446016 # объяснение пропорции дисперсии
> prop_varex <- pr_var / sum (pr_var)
> prop_varex [1:20]
[1] 0,10371853 0,07312958 0,062380104 0,07 [7] 0,043
0,02856433 0,02735888 0,02654774 0,02559876 0,02556797
[13] 0,02549516 0,02508831 0,02493932 0,024
[19] 0,023 936 936 936
[19] 0,023 936 0,073% отклонение. Второй компонент объясняет отклонение в 7,3%. Третий компонент объясняет отклонение в 6,2% и так далее. Итак, как нам решить, сколько компонентов выбрать для этапа моделирования?
Ответ на этот вопрос дает осыпная делянка. График осыпи используется для доступа к компонентам или факторам, которые объясняют большую часть изменчивости данных. Он представляет значения в порядке убывания.
#scree plot
> plot (prop_varex, xlab = "Main Component",
ylab = "Proportion of Variance Explained",
type = "b")
График выше показывает, что ~ 30 компонентов объясняют около 98.4% отклонение в наборе данных. Другими словами, с помощью PCA мы сократили 44 предиктора до 30 без ущерба для объясненной дисперсии. В этом сила PCA> Давайте проведем подтверждающую проверку, построив график кумулятивной дисперсии. Это даст нам четкое представление о количестве компонентов.
#cumulative scree plot
> plot (cumsum (prop_varex), xlab = "Main Component",
ylab = "Cumulative Proportion of Variance Explained",
90
Этот график показывает, что 30 компонентов приводят к дисперсии, близкой к ~ 98%.Поэтому в этом случае мы выберем количество компонентов 30 [ПК1 - ПК30] и перейдем к этапу моделирования. На этом шаги по внедрению PCA для данных поездов завершены. Для моделирования мы будем использовать эти 30 компонентов в качестве переменных-предикторов и следовать обычным процедурам.
Прогнозное моделирование с использованием компонентов PCA
После того, как мы вычислили основные компоненты обучающего набора, давайте теперь разберемся в процессе прогнозирования тестовых данных с использованием этих компонентов.Процесс прост. Точно так же, как мы получили компоненты PCA на обучающем наборе, мы получим еще один набор компонентов на тестовом наборе. Наконец, обучаем модель.
Но вот несколько важных моментов, которые нужно понять:
- Мы не должны комбинировать поезд и тестовый набор для одновременного получения компонентов PCA всех данных. Потому что это нарушило бы все предположение об обобщении, поскольку тестовые данные «просочились» в обучающую выборку. Другими словами, набор тестовых данных больше не останется «невидимым».В конце концов, это снизит способность модели к обобщению.
- Мы не должны выполнять PCA на тестовых и обучающих наборах данных отдельно. Потому что результирующие векторы из обучающего и тестового PCA будут иметь разные направления (из-за неравной дисперсии). В связи с этим мы в конечном итоге сравним данные, зарегистрированные по разным осям. Следовательно, результирующие векторы из данных поездов и испытаний должны иметь одинаковые оси.
Итак, что нам делать?
Мы должны выполнить точно такое же преобразование с тестовым набором, что и с обучающим набором, включая центр и функцию масштабирования.Сделаем это в R:
# добавить обучающий набор с основными компонентами
> train.data <- data.frame (Item_Outlet_Sales = train $ Item_Outlet_Sales, prin_comp $ x)
# нас интересует в первую очередь 30 PCAs
> train.data <- train.data [, 1: 31]
# запустить дерево решений
> install.packages ("rpart")
> library (rpart)
> rpart.model <- rpart (Item_Outlet_Sales ~., data = train.data, method = "anova")
> rpart.model
#transform test into PCA
> test.data <- pred (prin_comp, newdata = pca.test)
> test.data <- as.data.frame (test.data)
# выберите первые 30 компонентов
> test.data <- test.data [, 1: 30]
# сделать прогноз на основе тестовых данных
> rpart.prediction <- предсказать (rpart.model, test.data)
# Для удовольствия, наконец, проверьте свои результаты в таблице лидеров
> sample <- read.csv ("SampleSubmission_TmnO39y.csv")
> final.sub <- data.frame ( Item_Identifier = sample $ Item_Identifier, Outlet_Identifier = sample $ Outlet_Identifier, Item_Outlet_Sales = rpart.prediction)
> write.csv (final.sub, "pca.csv", row.names = F)
Процесс моделирования завершен после экстракции ПХА.Я уверен, что вы не будете довольны своим рейтингом в таблице лидеров после того, как загрузите решение. Попробуйте использовать случайный лес!
Для пользователей Python: Чтобы реализовать PCA в Python, просто импортируйте PCA из библиотеки sklearn. Интерпретация остается такой же, как объяснено выше для пользователей R. Конечно, результат получается таким же, как после использования R. Набор данных, используемый для Python, представляет собой очищенную версию, в которой были вменены недостающие значения, а категориальные переменные преобразованы в числовые. Процесс моделирования остается таким же, как описано выше для пользователей R.
import numpy as np
from sklearn.decomposition import PCA
import pandas as pd
import matplotlib.pyplot as plt
lot % in sklearn.preprocessing
import scale # Загрузить набор данных
data = pd.read_csv ('Big_Mart_PCA.csv')
# преобразовать его в массивы numpy
X = data.values
# Масштабирование значений
36 = масштаб (X)
pca = PCA (n_components = 44)
pca.fit (X)
# Сумма дисперсии, которую объясняет каждый компьютер
var = pca.explained_variance_ratio_
# Объясняет совокупное отклонение
var1 = nvarp.cumsum (np.explained десятичные знаки = 4) * 100)
Для получения дополнительной информации о PCA в python посетите scikit learn documentation. На этом я подошел к концу этого руководства. Не углубляясь в математику, я попытался познакомить вас с наиболее важными концепциями, необходимыми для использования этой техники. Это просто, но требует особого внимания при выборе количества компонентов. На практике мы должны стремиться сохранить только несколько первых k компонентов. Идея pca состоит в том, чтобы построить некоторые основные компоненты (Z << Xp), которые удовлетворительно объясняют большую часть изменчивости данных, а также взаимосвязь с переменной ответа. Вам понравилась эта статья? Вы поняли эту технику? Делитесь своими предложениями / мнениями в разделе комментариев ниже. Хотите добавить образцы данных в WooCommerce? Если вы настраиваете новый интернет-магазин, вы можете добавить некоторые образцы данных о продукте, чтобы посмотреть, как он будет выглядеть. Это также может помочь при тестировании перед запуском. В этой статье мы покажем вам, как легко добавить образцы данных в WooCommerce с изображениями продуктов. Использование фиктивных данных в WooCommerce позволяет увидеть, как выглядит ваш магазин WooCommerce с существующими товарами. Вы можете протестировать свою тему WooCommerce, попробовать основные плагины WooCommerce и настроить свой магазин, не добавляя собственные продукты. Добавление фиктивных продуктов WooCommerce позволяет повысить качество обслуживания клиентов в вашем магазине, когда вы используете реальные продукты. Подписаться на WPBeginner Если вы предпочитаете письменные инструкции, просто продолжайте читать. Если вы еще не запустили свой веб-сайт WordPress, вам необходимо получить подходящий хостинг WooCommerce. Нужна помощь в запуске магазина WooCommerce на WordPress? Следуйте инструкциям в нашем пошаговом руководстве по WooCommerce. Теперь, когда вы установили WooCommerce, давайте добавим в ваш магазин образцы данных о товарах. Во-первых, вам нужно посетить страницу Продукты »Все продукты в админке WordPress и нажать кнопку« Начать импорт ». После этого откроется страница импортера продукта. Отсюда вам нужно щелкнуть ссылку «Дополнительные параметры», чтобы развернуть настройки. После этого вам просто нужно скопировать и вставить следующий URL-адрес в поле для CSV-файла на вашем сервере. wp-content / плагины / woocommerce / sample-data / sample_products.csv Этот URL-адрес ведет непосредственно к образцу данных о продукте, который поставляется с плагином WooCommerce. Это самый быстрый способ добавить образцы данных. Другой вариант - загрузить файл sample_products.csv с вашего веб-сайта, а затем загрузить его снова. Просто перейдите по следующему URL-адресу: https://example.com/wp-content/plugins/woocommerce/sample-data/sample_products.csv Не забудьте заменить example.com своим доменным именем. Ваш браузер автоматически загрузит CSV-файл на ваш компьютер, который затем вы сможете загрузить на странице импортера продукта. После того, как вы загрузили файл CSV, вам будет предложено выбрать, как сопоставить данные с полями продукта в WooCommerce. Мы рекомендуем оставить все эти настройки по умолчанию и нажать кнопку «Запустить импортер» внизу. Импортеру WooCommerce может потребоваться минута или две, чтобы импортировать фиктивный контент. По завершении вы увидите сообщение «Импорт завершен». Затем вы можете нажать кнопку «Просмотреть продукты», чтобы увидеть весь импортированный контент. Образцы продуктов WooCommerce будут отображаться как обычные продукты. Затем вы можете редактировать их, как любые продукты WooCommerce, предварительно просматривать их с помощью своей темы WooCommerce и опробовать различные плагины WordPress. WooCommerce не имеет генератора заказов. Самый простой способ создать фиктивные заказы в WooCommerce - просто пройти процесс оформления заказа самостоятельно. Это легко сделать, не тратя денег и не меняя цены на товары. Просто перейдите на страницу WooCommerce »Настройки» Платежи в админке WordPress и включите опцию оплаты «Оплата при доставке».Не забудьте нажать кнопку «Сохранить изменения». Далее вам нужно посетить ваш магазин и заказать несколько фиктивных товаров. После этого вы увидите свои заказы на странице WooCommerce »Заказы . Вы можете создать столько заказов на образцы, сколько захотите. После того, как вы закончите использовать образцы данных, вы можете удалить фиктивные продукты и заказы. Чтобы удалить заказы, перейдите на страницу WooCommerce »Заказы в админке WordPress.Здесь вам просто нужно выбрать все заказы и использовать меню «Массовые действия», чтобы переместить их все в корзину. Просто выберите «Переместить в корзину» в раскрывающемся списке и нажмите кнопку «Применить». Чтобы удалить продукты, перейдите на страницу Продукты »Все продукты в админке WordPress. Опять же, просто выберите все продукты и используйте меню «Массовые действия». Идите вперед и выберите «Переместить в корзину», затем нажмите кнопку «Применить». Мы надеемся, что эта статья помогла вам научиться добавлять образцы данных в WooCommerce.Теперь, когда ваш магазин готов, мы рекомендуем вам настроить отслеживание конверсий WooCommerce, чтобы получить информацию. Вы также можете ознакомиться с нашим сравнением лучших услуг телефонной связи для бизнеса и лучших услуг электронного маркетинга для развития вашего бизнеса электронной коммерции. Если вам понравилась эта статья, то подпишитесь на наш канал YouTube для видеоуроков по WordPress. Вы также можете найти нас в Twitter и Facebook. Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 830 ISSN 2229-5518 Аутентификация динамики нажатия клавиш на основе анализа основных компонентов и нейронной сети Dr.Шайма Хамид Шейкер, доктор Рияд Джаббар Сайдани, Мина Хидхир Обэйд Краткое содержание. В связи с постоянно растущими системными угрозами и требованиями безопасности для борьбы с этими угрозами возникает необходимость в создании надежных систем безопасности. Системы аутентификации на основе паролей уязвимы для парольных атак. Система аутентификации с динамикой нажатия клавиш считается одним из альтернативных современных надежных решений из-за ее дешевизны, ненавязчивости и удобства использования. В этом документе пять временных характеристик, а именно длительность нажатия клавиш, задержки вверх-вниз, вниз-вниз, задержки вверх-вверх и общий набор текста, извлекаются из 10 пользователей с 20 пробами для каждого пользователя и объединяются для использования для проверки пользователя с помощью Многослойный классификатор нейронной сети персептрона (MLP NN) с уменьшением размерности с использованием анализа главных компонентов (PCA).Результаты показали повышение точности системы за счет сокращения PCA. Не только коэффициент ложного отклонения (FRR) и коэффициент ложного принятия (FAR) снижаются до 24% и 6% соответственно, но также сокращаются среднеквадратическая ошибка нейронной сети (MSE) и время обучения с развертыванием PCA. Ключевые слова: сокращение функций, динамика нажатия клавиш, MLP NN, PCA, функции синхронизации, общий набор текста, аутентификация пользователя. —————————— —————————— Системы и сети OMPUTER используются почти во всех аспектах нашей повседневной жизни.В результате угрозы безопасности компьютеров и сетей также значительно возросли Динамика нажатия клавиш определяется в [7] как «процесс анализа способа набора текста пользователями путем отслеживания ввода с клавиатуры и определения их на основе шаблонов в их ритме набора текста». Он основан на предположении, что у каждого машинистки есть свой собственный набор текста. уникальный способ набора текста, который отличает его от других машинисток. Для аутентификации пользователя системе динамики нажатия клавиш требуются данные, из которых извлекаются функции набора текста, чтобы построить модель, которая будет использоваться для проверки заявленного пользователя. Обычно используемые временные характеристики, которые могут быть извлечены: KeyDuration = Ri - Pi Где: Ri: время отпускания i-й клавиши. Pi: время нажатия i-й клавиши. (1) IJSER © 2014 http://www.ijser.org Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 831 ISSN 2229-5518 • Наверх -Задержка вниз : также называется «время полета», разница во времени между отпусканием клавиши и нажатием следующей клавиши. UpDownLatency = Pi +1 - Ri (2) Решение ошибочной классификации в NN состоит в том, чтобы удалить задержку DownDownLatency = Pi +1 - Pi (3) UpUpLatency = Ri +1 - Ri (4) TotalTyping = Ri = N - Pi = 1 Где: N : номера строковых символов. (5) NN - это массивно-параллельные вычислительные системы, состоящие из чрезвычайно большого числа простых процессоров, называемых нейронами, с множеством взаимосвязей. Модели NN пытаются использовать некоторые организационные принципы, которые, как считается, используются человеческим мозгом [9]. Одной из областей, для которых используется NN, является распознавание образов, где входной образец назначается одному из многих заранее определенных классов. , которая отображает группы входных данных на набор целевых выходов i.е. контролируемая сеть. Его название указывает на то, что он состоит из нескольких слоев: один или несколько скрытых слоев и выходной слой. Каждый слой состоит из нескольких нейронов. В качестве алгоритма обучения устойчивое распространение является хорошим кандидатом для быстрого обучения и меньшего потребления памяти по сравнению с другими алгоритмами обучения, поскольку обновление весов зависит от знака, а не от величины частичной производной ошибки [10] . Предлагаемая модель проиллюстрирована на рис. 1, где десяти пользователям предлагается зарегистрироваться в системе.Каждый пользователь i вводит свой десятичный пароль j = 20 раз для создания базы данных, которая будет необходима для его проверки каждый раз, когда он попытается получить доступ позже. Пользователь вводит свой логин и пароль. Функции синхронизации извлекаются из пароля прозрачно, пока пользователь его набирает. После 20 вводов имя пользователя и пароль добавляются к векторам функций и сохраняются как шаблоны в базе данных. PCA выполняется для функций, чтобы уменьшить их, прежде чем они будут использоваться в качестве входных данных для NN, подлежащего обучению.Обученный NN также сохраняется в базе данных. Построенная модель, включающая изученную NN и шаблоны функций (представленные фиолетовыми фигурами), теперь готова к использованию для классификации пользователя. IJSER © 2014 http://www.ijser.org International Journal of Scientific & Engineering Research, Volume 5, Issue 6, June-2014 832 ISSN 2229-5518 , введя его имя пользователя и пароль, те же самые функции ввода извлекаются из пароля после проверки действительности пользователя и правильности пароля путем сравнения их с шаблонами зарегистрированных пользователей.Эти функции ввода передаются обученному NN, чтобы классифицировать заявленного пользователя как аутентифицированного или нет. Десяти пользователям было предложено ввести свои имена пользователей и собственные пароли с условием, что пароль должен быть длиной 10 для более четырех сеансов продолжительностью две недели каждый, пять раз для каждого сеанса. Таким образом, общее количество собранных образцов составляет 200 образцов. Образцы собираются с помощью клавиатуры Dell Inspiron, и пользователи сидели на одном стуле при одинаковых условиях освещения. Рис. 2. Вектор временных характеристик пользователя №1. Рис. 1. Предлагаемое переполнение системы аутентификации динамики нажатия клавиш. Пока пользователи вводят свой собственный пароль, были извлечены пять функций синхронизации, описанных в разделе 2.2. Для каждого испытания эти функции объединяются, где длительность клавиш (KD) из 10 букв сопровождается 9 задержками вверх-вниз (UD), за которыми следуют 9 задержек вниз-вниз (DD), а затем Чтобы повысить производительность системы и сократить время обучения NN, PCA используется в качестве этапа предварительной обработки для сокращения функций перед изучением NN с этими векторами функций. Из-за несогласованности векторов признаков, т. Е. Общее время набора текста намного больше, чем для других функций, как показано на рисунке 2, нормализация z-показателя выполняется для векторов признаков перед использованием PCA. MLP NN используется для построения модели, которая позже будет использоваться при верификации пользователя. Он реализован в виде нейронной сети распознавания образов с использованием скрипта Matlab. Предлагаемая NN представляет собой двухуровневую сеть с прямой связью с 70 скрытыми сигмовидными нейронами и 10 сигмовидными выходными нейронами, как показано на рис. Фиг.3. Используемая общая архитектура сети. Предлагаемая сеть обучается с использованием метода устойчивого распространения (RPROP) для быстрого обучения. Обученный NN сохраняется для использования для проверки. IJSER © 2014 http://www.ijser.org Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 833 ISSN 2229-5518 Рис.4. Детальная архитектура используемой сети. Проверка пользователя осуществляется с использованием ранее зарегистрированных образцов и обученной сети. Те же самые временные характеристики извлекаются и объединяются в один вектор признаков длиной 38, как объяснено в разделе 4.3, и умножаются на матрицу преобразования, полученную из PCA, чтобы уменьшить длину вектора до того же размера, что и новые компоненты. Уменьшенный вектор также умножается на стандартное отклонение, чтобы устранить его влияние. Предлагаемая модель реализована с использованием Windows Forms Application в среде Visual Studio 2012, за исключением PCA и NN, которые построены с использованием MATLAB 2013. Основным интерфейсом является приложение Windows Forms, а MATLAB действует как COM-сервер. Рис. 5. Интерфейсное окно предлагаемой модели. Рис. 6. Окно извлечения признаков. IJSER © 2014 http://www.ijser.org Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 834 ISSN 2229-5518 ТАБЛИЦА 2 СООТВЕТСТВИЕ ПК С ХАРАКТЕРИСТИКАМИ Рис. 7. Дисперсии ПК первых 6 компонентов. Как упоминалось в разделе 3.2, полученные ПК не коррелируют друг с другом. Таблица 1 доказывает это, показывая корреляцию между каждым ПК с другими ПК, равную нулю, за исключением самого себя. ТАБЛИЦА 1 КОРРЕЛЯЦИЯ МЕЖДУ EEN PCS ПК 1 ПК 2 ПК 3 ПК 4 1 - - - - PC 2 - - ПК 3 0 0 1 0 0 0 1 PC 5 0 0 0 0 1 1 В этом разделе показаны результаты внедрения обученного NN Var = функции; PC = Главный компонент Положительное значение указывает на положительную линейную зависимость: по мере увеличения значений этой переменной PC также увеличивается в своих значениях по точному линейному правилу. Отрицательное значение указывает на отрицательную линейную зависимость: по мере того, как эта переменная увеличивается на своих значений, этот PC также уменьшается в своих значениях по точному линейному правилу. IJSER © 2014 http://www.ijser.org Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 835 ISSN 2229-5518 Рис. 10. Производительность проверки MSE без PCA Рис. 8. Путаница между выходами и целями без PCA Рис.11. Производительность проверки MSE с PCA Рис. 12. Время обучения NN с PCA и без него Рис. 9. Путаница между выходами и целями без PCA В этом разделе показано внедрение обученной NN на извлеченные функции на этапе проверки. IJSER © 2014 http://www.ijser.org Международный журнал научных и инженерных исследований, том 5, выпуск 6, июнь 2014 г. 836 ISSN 2229-5518 На высоком уровне безопасности, где порог ошибки составляет 0,9, FRR упал с 53% до 36% с развертыванием PCA, в то время как FAR остается на прежнем уровне 0%.С порогом ошибки, используемым в предлагаемой системе, равным 0,5, FRR снизился с 34% до 24%, в то время как FAR упал с 10% до 6% с развертыванием PCA. ТАБЛИЦА 3 ОБЗОР РЕЗУЛЬТАТОВ Рис. 13. FAR, FRR и EER для различных пороговых значений ошибок без PCA Рис.14. FAR, FRR и EER для различных пороговых значений ошибок с PCA В таблице 3 суммированы результаты, полученные с помощью предложенной системы, по сравнению с результатами, полученными без уменьшения характеристик с использованием PCA. Результаты включают в себя частоту ошибочной классификации обученной NN, лучшую эффективность проверки MSE, время, необходимое для обучения NN, FAR и FRR при ошибке [1] Romain Giot , Мохамад Эль-Абед и Кристоф Розенбергер, «Биометрия: Глава 8: Обзор динамики нажатия клавиш», стр. 157–182, июнь 2011 г. [2] Дэвид Реби, Сован Лек, Иоаннис Димопулос, Жан Иоахим, Жак Лауга , «Искусственные нейронные сети как метод классификации в поведенческих науках», ELSEVIER, Behavioral Processes, vol.40, pp. 35–43, 1997. [3] Прит Индер Сингх, Гур Сундар Митра Тхакур, «Расширенная система безопасности на основе паролей, основанная на поведении пользователей с использованием нейронных сетей», International Journal of Information Engineering and Электронный бизнес (IJIEEB) , т. 4, вып. 2, pp. 29-35, April 2012. [4] Джунита Мохамад-Салех, Брайан С. Хойл, «Улучшенная нейронная сеть IJSER © 2014 http://www.ijser.org International Journal of Scientific И инженерные исследования, том 5, выпуск 6, июнь-2014 837 ISSN 2229-5518 Производительность с использованием анализа главных компонентов в Matlab ”, Международный журнал компьютеров, Интернета и управления, том.16, № 2, стр. 1-8, май-август, 2008 г. [5] Н. Харун, С.С. Длей и В.Л. Ву, «Производительность системы биометрической аутентификации нажатия клавиш с использованием многослойного перцептронного нейрона. Сеть (MLP NN) », Proc. IEEE Symp. Сети коммуникационных систем и цифровая обработка сигналов (CSNDSP), стр. 711-714, июль 2007. [6] Сучета Чаухан, Према К.В., «Влияние снижения размерности на производительность в искусственной нейронной сети для пользователя. Аутентификация », Тр.IEEE 3rd International. Конференция по продвинутым вычислениям (IACC), стр. 788 - 793, февраль 2013 г. [7] Патрик Элфтманн, «Безопасные альтернативы механизмам аутентификации на основе пароля», дипломная работа, Лаборатория надежных распределенных систем, RWTH Aachen University , Ахен, Германия, октябрь 2006 г. [8] Ю Чжун, Юнбинь Дэн, Анил К. Джайн, «Динамика нажатия клавиш для аутентификации пользователя», Proc. Конференция компьютерного общества IEEE.Семинары по компьютерному зрению и распознаванию образов (CVPRW), стр. 117 - 123, июнь 2012. [9] Анил К. Джайн, Цзяньчан Мао, «Искусственная нейронная сеть: Учебное пособие», IEEE Компьютер, т. 29, нет. 3, Mar 1996. [10] Мартин Ридмиллер, «Расширенное контролируемое обучение в многослойных персептронах - от обратного распространения к адаптивным алгоритмам обучения», ELSEVIER, Computer Standards & Interfaces, vol. 16, нет. 3, pp. 265–278, Jul 1994. [11] Норм О'Рурк, Ларри Хэтчер, «Пошаговый подход к использованию SAS для факторного анализа и моделирования структурных уравнений» Second Edition, Chapter 1 PRINCIPAL КОМПОНЕНТНЫЙ АНАЛИЗ », 2013. [12] Линдси И. Смит, «Учебник по анализу основных компонентов», https://www.google.iq/url?sa=t&rct=j&q=&esrc=s&source=web&c d = 1 & cad = rja & uact = 8 & ved = 0CCEQFjAA & url = HTTPS% 3A% 2F% 2Fww w.ce.yildiz.edu.tr% 2Fpersonal% 2Fsongul% 2Ffile% 2F1097% 2Fprincip al_components.pdf & е = Ip-cU6DiBth40gXJ5YCAAg & USG = AFQjC NFiLc0xvwIoZ6Iz3d3mTTkgvCJGsg & Sig2 = 7Jt8TtHR0kz5mnBXbAU PTG, 2002 [13] Matthias Scholz , Иоахим Селбиг, «Визуализация и анализ молекулярных данных», https: // www.google.iq/url?sa=t&rct=j&q=&esrc = s & source = web & cd = 2 & cad = rja & uact = 8 & ved = 0CCsQFjAB & url = htt p% 3A% 2F% 2Fwww.researchosisaldata% 2Fislearisaldata_and_data_data_fissearchsale_data% 2Fislearisaldata_data% 2Fislearchsale 2F8f0e99 66f3839de13cff25f0e1c1e44c.pdf & е = JJycU5kFuiw0QWo3IDoCw и нам г = AFQjCNFjF3UFnj12Zpwe6OsTuHonOfTbQQ & Sig2 = oQ512_fut5p wlPb6D1QRzw 2007 IJSER © 2014 http://www.ijser.org Одна из целей этой работы состоит в том, чтобы выразить разнообразие базы данных MOF с точки зрения характеристик, которые могут быть связаны с химией, которая используется при синтезе MOF, а также в создании библиотек гипотетических структур.В настоящее время разработаны различные стратегии для представления MOF с векторами признаков 9,10,11,12 . Однако глобальные дескрипторы материалов 9,13,14,15,16 , которые используются в настоящее время, не идеальны для наших целей. Мы хотели бы напрямую подключиться к структурным строительным блокам MOF, которые очень напоминают химическую интуицию химиков MOF, в которой MOF представляет собой комбинацию геометрии пор и химического состава (то есть металлических узлов, лигандов и функциональных групп) 6 , 17 .Однако важно отметить, что при разработке этих дескрипторов невозможно полностью разделить различные эффекты и области действия. Например, для некоторых MOF добавление функциональной группы может полностью изменить форму поры. Следовательно, в зависимости от деталей различных типов дескрипторов и представляющих интерес свойств, это можно рассматривать в основном как эффект формы поры, в то время как другие наборы описаний будут относить его к эффекту функциональной группы. Для описания геометрии пор нанопористых материалов мы используем простые геометрические дескрипторы, такие как размер пор и объем 18 .Для химии MOF мы адаптируем обновленные дескрипторы автокорреляций (RAC) 19 , которые были успешно применены 19,20,21,22 для построения взаимосвязей структура-свойство в химии переходных металлов 19,23 . RAC - это дискретные корреляции между эвристическими атомными свойствами (например, электроотрицательностью Полинга, зарядом ядра и т. Д.) Атомов на графе. Мы вычисляем RAC, используя молекулярные или кристаллические графы, полученные из матрицы смежности, вычисленной для примитивной ячейки кристаллической структуры (см. Раздел «Методы»).Чтобы описать химию MOF, мы расширили обычные RAC, чтобы включить дескрипторы для всех доменов материала MOF, а именно химии металлов, химии линкеров и функциональных групп (рис. 1 и раздел «Методы»). RAC с металлическими центрами вычисляются на кристаллическом графике. RAC линкера и функциональной группы вычисляются на соответствующем молекулярном графе линкера. Линкерная химия включает два типа RAC, а именно полный линкер и линкерные соединяющие атомы.На графиках показан начальный атом (зеленым) и соседний атом (оранжевый), используемые для определения дескрипторов RAC (см. Раздел «Методы»). Мы рассматриваем несколько баз данных MOF: одну экспериментальную и пять с предсказанными in silico структурами (более подробную информацию о базах данных см. В дополнительном примечании 2). Готовая к вычислениям экспериментальная база данных (CoRE) 2,24,25,26 MOF представляет собой выборку синтезированных MOF. Первая база данных MOF, созданная in silico (hMOF), была разработана Wilmer et al. 3 с использованием алгоритма «Tinkertoy» путем привязки строительных блоков MOF для формирования 130 000 структур MOF. Однако этот алгоритм Тинкертой дал только несколько базовых сетей 27 . Альтернативный подход, использующий алгоритмы на основе топологии, был применен Gomez-Gualdron et al. 28 для их базы данных ToBaCCo (~ 13 000 структур) и Boyd and Woo 4,29 для их BW-DB (более 300 000 структур). Подробный обзор этой темы можно найти здесь 30 . Мы используем CoRE-2019 и разнообразное подмножество из 20 000 структур из BW-DB (называемого BW-20K), чтобы установить достоверность дескрипторов материалов. Кроме того, относительно небольшая база данных из около 400 структур, разработанная Anderson et al. 14 (ARABG-DB) был включен для сравнения с их выводами о важности структурных доменов 14 . В этом тесте мы фокусируемся на адсорбционных свойствах, поскольку их точное предсказание требует значимого дескриптора как для химического состава, так и для геометрии пор.Изучаем адсорбционные свойства метана и углекислого газа. Из-за различий в химическом составе (т.е. формы и размера молекул, а также ненулевого квадрупольного момента диоксида углерода) создание пористых материалов с желаемыми адсорбционными свойствами требует разных стратегий для каждого газа. Чтобы подчеркнуть эти различия, мы изучаем адсорбционные свойства при трех различных условиях, а именно при бесконечном разбавлении (то есть в режиме Генри), низком давлении и высоком давлении. Сначала мы устанавливаем, что наши дескрипторы отражают химическое сходство структур MOF.В качестве теста мы показываем, что модели машинного обучения на основе экземпляров (регрессия гребня ядра (KRR)), использующие эти дескрипторы, могут точно предсказать адсорбционные свойства. Модель KRR с ядром радиальной базисной функции использует только сходство, которое количественно оценивается с помощью попарных расстояний в пространстве признаков; следовательно, производительность модели может продемонстрировать достоверность дескрипторов. Модели KRR показывают хорошую производительность при прогнозировании адсорбционных свойств баз данных CoRE-2019 и BW-20K (см. Дополнительное примечание 3 для четностей и статистики).Мы заметили, что для тех свойств, которые в меньшей степени зависят от химического состава, например, приложений высокого давления CH 4 и CO 2 , геометрических дескрипторов достаточно для описания материалов со средней относительной погрешностью (RMAE) в прогноз потребления газа ниже 5%. Кроме того, если мы сравним относительное ранжирование материалов, мы также получим удовлетворительное согласие, выраженное коэффициентом ранговой корреляции Спирмена (SRCC) выше 0,9. С другой стороны, для приложений, где играет роль химия, например.g., коэффициент Генри CO 2 , химические дескрипторы необходимы для точного прогнозирования свойств материалов (RMAE ~ 5% и SRCC ~ 0,8). Производительность и точность наших моделей сопоставимы с результатами предыдущих исследований 14,31,32,33,34,35 (см. Полный список в исх. 36 ). Однако, чтобы иметь возможность сравнивать точность и производительность различных моделей и наборов функций, необходимо выполнить сравнительное исследование с использованием фиксированного набора материалов с большим разнообразием и их соответствующих свойств, например, мы наблюдаем за производительностью машинного обучения. модели значительно различаются от одной базы данных к другой. Значимость химических дескрипторов дополнительно иллюстрируется предсказаниями максимального положительного заряда (MPC) и минимального отрицательного заряда (MNC) структур MOF (SRCC выше 0,9 и 0,7 соответственно). Геометрические дескрипторы практически не имеют значения для этих сборов (SRCC ниже 0,5 для всех случаев). Это объясняет относительно низкую эффективность в прогнозировании адсорбционных свойств CO 2 при низких давлениях с использованием только геометрических дескрипторов, поскольку электростатическое взаимодействие играет решающую роль.Этот анализ показывает, что наши RAC и геометрические дескрипторы являются значимыми представлениями для химического пространства MOF для адсорбции как CH 4 , так и CO 2 во всем диапазоне давлений. Как следствие, если два материала имеют одинаковые дескрипторы, их адсорбционные свойства будут одинаковыми. Следовательно, теперь мы можем количественно оценить, как разные области пространства дизайна охвачены разными базами данных. Мы определяем текущую область химического проектирования как комбинацию всех синтезированных материалов и структур, предсказанных in silico, т.е.е., все материалы в известных базах данных. Реальное пространство химического дизайна, конечно, может быть намного больше, поскольку можно ожидать, что будут обнаружены новые классы MOF. Поучительно визуализировать, как каждая база данных MOF покрывает текущее пространство дизайна. Это пространство дизайна, как описано в наших дескрипторах, является многомерным пространством, и для его визуализации мы делаем проекцию в двух измерениях. Проекция геометрии пор в нашем текущем проектном пространстве показана на рис. 2a.Цветовое распределение показывает градиент размера пор MOF, от малых до больших пор, перемещающихся на карте слева направо. На других панелях показано, как различные базы данных MOF покрывают это пространство. Распределения геометрических свойств баз данных существенно отличаются друг от друга (рис. 2b – d). Например, экспериментальные MOF (CoRE-2019) в основном находятся в области малых пор на карте. Примечательно, что гипотетические базы данных также имеют очень разные распределения.В то время как BW-DB покрывает области промежуточных размеров пор, ToBaCCo смещается к областям больших пор пространства проектирования. Для проецирования пространства геометрических дескрипторов MOF на 2D-карту мы используем t-распределенное стохастическое вложение соседей (t-SNE) 67 (см. Дополнительное примечание 6 для анализа главных компонентов (PCA)). Метод t-SNE сохраняет локальное сходство, обеспечивая сопоставление похожих структур близко друг к другу в двух измерениях. a Текущий цвет пространства дизайна с самой большой включенной сферой. В ( b ), ( c ) и ( d ) зеленые, синие и красные точки представляют материалы в базах данных CoRE-2019, BW-DB и ToBaCCo, соответственно, которые наложены на дизайнерское пространство представлено серым цветом. Графики PCA показывают аналогичное распределение баз данных (см. Дополнительное примечание 6). Гипотетические структуры были созданы для исследования пространства проектирования MOF за пределами экспериментально известных структур.На рис. 3 мы показываем, как эти базы данных покрывают пространство проектирования (см. Дополнительное примечание 6 для распределения каждой базы данных и метода PCA). Мы используем показатели разнообразия 37 , чтобы количественно оценить охват этих баз данных с точки зрения разнообразия (V), баланса (B) и диспаратности (D). Геометрия пор, химия линкеров и функциональные группы дизайна пространств хорошо охвачены и взяты из гипотетических баз данных. Однако мы наблюдаем серьезное ограничение разнообразия, в частности, разнообразия химии металлов в гипотетических базах данных (рис.3б). По сравнению с экспериментальной базой данных, разнообразие химического состава металлов MOF в гипотетических базах данных на удивление невелико; присутствует только ограниченное количество металлических центров MOF (18 металлических SBU для всех гипотетических баз данных, см. дополнительное примечание 14). Метод t-SNE был использован для проецирования пространств дескрипторов a пор, b , химии линкеров c и пространств дескрипторов функциональных групп d на 2D-карты.Только дескрипторы до второй координационной оболочки были включены для химии металлов, чтобы подчеркнуть местную среду химии металлов. На каждой панели структуры из гипотетических баз данных окрашены и наложены на все известное пространство дизайна, представленное серым цветом. На радиолокационных диаграммах показаны три показателя разнообразия: разнообразие (V), баланс (B) и несоответствие (D) для трех баз данных. Для этого анализа сначала мы дискретизируем пространство на фиксированное количество интервалов. Разнообразие измеряет количество бункеров, в которых отбираются пробы, уравновешивает равномерность распределения материалов между бункерами, в которых отбираются пробы, и неравномерность распределения бункеров для отбора проб (более подробную информацию см. В разделе «Методы»). Выбор органического линкера и размещение функциональных групп легко перечислить; можно взять большие базы данных органических молекул 38 в качестве богатого источника возможных линкеров MOF или функциональных групп. Напротив, металлические узлы MOF обычно становятся известны только после того, как MOF синтезирован. Например, в настоящее время мы не можем предсказать, что если атомы цинка во время образования MOF будут кластеризоваться в цинковом лопаточном колесе (например, в Zn-HKUST-1) 39 , единичный узел (например, в Zn-HKUST-1).g., в ZIF) 40 , Zn 4 O (например, в IRMOF) 6 , или в совершенно новую конфигурацию. Разнообразие в химии металлов было дополнительно сокращено из-за выбора исследователей и / или ограничений в алгоритмах сборки структуры MOF. Например, некоторые из гипотетических баз данных MOF намеренно сосредоточены на конкретных подклассах MOF для систематического исследования взаимосвязей между структурой и свойством. Например, исследование Gomez-Gualdron et al. 41 , который фокусируется на создании стабильных MOF с использованием металлических узлов на основе циркония для хранения газа, Witman et al. 42 на одномерных стержневых MOF с открытыми металлическими площадками для захвата CO 2 , и Moosavi et al. 43 на ЗИФах с различными функциональными группами и лежащими в основе сетками для механической устойчивости. Наконец, in silico сборка MOF, обладающих сложными узлами, которые связаны через несколько линкеров, особенно в сети с низкой симметрией, все еще является сложной задачей для текущих алгоритмов генерации структур 44 . Поэтому мы ожидаем, что на карте химии металлов на рис.3b, который будет найден в ближайшие годы. Мы проиллюстрируем важность количественной оценки разнообразия различных баз данных на трех примерах. Первый пример показывает, как машинное обучение может быть использовано для понимания того, как производительность материала связана с его базовой структурой 14,19,21 . Поскольку наши дескрипторы представляют каждый домен архитектуры MOF, мы можем количественно оценить относительную важность этих доменов для адсорбции CH 4 и CO 2 . В каждой базе данных важность переменных значительно различается для разных газов и разных условий адсорбции (см. Дополнительное примечание 5). Эти результаты следуют нашей интуиции; химический состав материала более важен в режиме низкого давления, в то время как при высоких давлениях геометрия пор является доминирующим фактором. Более того, мы наблюдаем, что химический состав материала более важен для CO 2 , чем для адсорбции CH 4 . Если бы каждая из этих баз данных охватывала репрезентативное подмножество химии MOF, можно было бы ожидать, что каждая база данных даст аналогичный результат для важности различных переменных.Однако при сравнении разных баз данных мы наблюдаем разительные различия. Наглядным примером является адсорбция CO 2 при низком давлении. Андерсон и др. 14 пришли к выводу на основе анализа базы данных (ARABG-DB), что химический состав металлов не является важной переменной для адсорбции CO 2 . Однако рис. 4a показывает, что для каждой из этих баз данных различные характеристики материалов важны для моделей при прогнозировании адсорбции CO 2 . Например, геометрия пор является наиболее важной переменной в BW-20K, химия металлов в CoRE-2019 и функциональные группы в ARABG-DB.Поскольку свойства материалов были рассчитаны с использованием единой методологии для всех баз данных, эти различия в важности переменных происходят из различий в базовом распределении баз данных материалов (см. Рис. 3 и Дополнительное примечание 6 для распределения баз данных). Например, причина, по которой химия металлов не была определена как важный фактор Anderson et al. состоял в том, что химия металлов не была изучена в достаточной степени в их базе данных, поскольку для подсчета структуры использовались только четыре SBU.Кроме того, поскольку эти значения имеют относительную важность, можно утверждать, что в MOF CoRE-2019 функциональные группы не использовались в такой степени, как химия металлов. Здесь важно отметить, что наш анализ основан на современных методах, которые используются в скрининговых исследованиях, то есть на общих силовых полях и твердых кристаллах. Было бы интересно увидеть, как улучшения, например, описания открытых площадок в MOF изменят этот анализ. Если изменения будут значительными, такие улучшения, вероятно, окажут большое влияние. Круговые диаграммы, показывающие значения добавок Шапли (SHAP) (важность переменных) для a адсорбция CO при низком давлении 2 и b CH 4 доставляемая производительность. Значения SHAP были вычислены для моделей регрессии случайного леса с использованием обучающего набора CoRE-2019 и BW-20K, а также всех структур в ARABG-DB. Для химических свойств важность переменных была суммирована по всем глубинам RAC для каждого из эвристических атомных свойств.См. Значение этикеток в разделе «Методы». Аналогичные значения важности переменных были получены с использованием других методов (см. Дополнительное примечание 5). В нашем втором примере мы фокусируемся на том, как наш анализ разнообразия может помочь нам определить возможности для проектирования новых структур. В настоящее время синтезировано более 90 000 MOF, и хотелось бы быть уверенным, что MOF 90 001 добавляет соответствующую информацию. Аналогичным образом, для гипотетических баз данных можно добавлять новые структуры в любое скрининговое исследование, только если они дополняют многие из уже существующих. Для улавливания CO 2 из дымовых газов, что соответствует адсорбции CO 2 при низком давлении в нашем исследовании, мы показали, что химию металлов нельзя игнорировать (рис. 4a). Наш анализ разнообразия показывает, что эта область недостаточно хорошо охвачена гипотетическими базами данных (см. Рис. 3). Следовательно, изучение химического состава различных металлов в этих базах данных увеличит разнообразие этих баз данных. Для этого мы разработали методологию добычи уникальных строительных блоков MOF из экспериментальных баз данных MOF (см. Раздел «Методы»).В дополнительном примечании 7 мы показываем некоторые из этих SBU, которые еще не использовались для подсчета структур в этих гипотетических базах данных, и включение этих недостающих структур в предварительное исследование может привести к обнаружению материалов с превосходными характеристиками. Для хранения метана наш анализ показывает, что самым важным фактором является геометрия пор (см. Рис. 4b). Все базы данных подтверждают, что геометрия пор является наиболее важным фактором. Для этого приложения каждая из баз данных имеет достаточное разнообразие геометрических структур, и другие факторы не имеют значения.Это наблюдение дает важное обоснование провокационному выводу Simon et al. 45 , что нет смысла искать новые конструкции для хранения метана, поскольку не ожидается, что они будут работать значительно лучше для этого приложения. Саймон и др. пришли к такому выводу в результате большой выборки 650 000 случайных структур из множества баз данных по различным классам нанопористых материалов. Наше исследование показывает, что действительно большой выбор структур из разных баз данных будет охватывать все геометрическое пространство текущего проектного пространства.Чтобы значительно превзойти самые эффективные материалы, потребуется совершенно новый химический состав и механизм, например, гибкость каркаса 46 . В последнем примере мы сосредоточимся на влиянии систематической ошибки в базах данных на обобщаемость и переносимость прогнозов машинного обучения. Интуитивно можно было ожидать, что если мы включим структуры из всех областей пространства дизайна в наш обучающий набор, наши результаты машинного обучения можно будет перенести в любую базу данных.Проиллюстрируем этот момент на двух базах данных CoRE-2019 и BW-DB. Мы случайным образом выбираем 2000 структур, которые используем в качестве тестового набора. Разнообразный набор структур на основе химических и геометрических дескрипторов был получен из остальных структур в этих двух базах данных 47,48 . Точность моделей случайного леса, обученных с использованием этого разнообразного набора, сравнивается с моделями, обученными с использованием обучающих наборов из каждой базы данных на рис. 5. Очевидно, что модели, которые были обучены в базах данных, которые смещены в некоторые области пространства проектирования, приводят к плохим результатам. переносимость для предсказаний в невидимых регионах космоса.Напротив, и это неудивительно, модель, обученная с использованием разнообразного набора, относительно хорошо работает для обеих баз данных. Кроме того, разнообразие обучающих наборов способствует более эффективному обучению. В дополнительных материалах мы показываем кривые обучения, которые демонстрируют, что модели, обученные на разнообразном наборе, имеют систематически более низкую ошибку, чем модели, обученные с использованием предвзятых баз данных. печать var1
[10,37 17,68 23,92 29,7 34,7 39,28 43,67 46,53 49,27
51,92 54,48 57,04 59,59 62,1 64,59 67,08 69,55 72.
74.39 76.76 79.1 81.44 83.77 86.06 88.33 90.59 92.7
94.76 96.78 98.44 100.01 100.01 100.01 100.01 100.01 100.01
100.01 100.01 100.01 100.01 100.01 100.01 100.01 1000003
# Глядя на график выше, я беру 30 переменных
pca = PCA (n_components = 30)
pca.fit (X)
X1 = pca.fit_transform (X)
print X1
Что следует помнить
Конечные примечания
Как добавить образцы данных в WooCommerce (+ изображения продуктов)
Зачем добавлять образцы данных в WooCommerce?
Видеоурок
Настройка вашего магазина WooCommerce для демонстрации данных
Добавление данных образца в WooCommerce
Создание образцов заказов в WooCommerce
Как удалить образец данных в WooCommerce
Аутентификация динамики нажатия клавиш на основе анализа основных компонентов и нейронной сети
Аутентификация динамики нажатия клавиш на основе анализа основных компонентов и нейронной сети
. Кроме того, обычные системы аутентификации на основе паролей уязвимы для парольных атак. Пароль может быть утерян или украден. С другой стороны, динамика нажатия клавиш, которая представляет ритмы набора текста, которые пользователь демонстрирует при наборе текста на клавиатуре, обеспечивает высокий уровень безопасности благодаря своей ненавязчивости. Кроме того, его дешевая реализация является хорошим фактором, делающим его более удобным для пользователя по сравнению со сканированием отпечатков пальцев и радужной оболочки глаза, которым требуется дополнительное оборудование для аутентификации, в то время как все, что требуется для динамики нажатия клавиш, - это клавиатура и код, который использует тайминги клавиш. для аутентификации пользователя.Таким образом, динамику нажатия клавиш можно комбинировать с аутентификацией на основе пароля для достижения надежной аутентификации.
Динамика нажатия клавиш зависит от временных характеристик, извлеченных во время набора текста пользователем. Наиболее часто используемые функции представлены длительностью ключа и тремя ключевыми задержками: задержка вверх-вниз, задержка вниз-вниз и задержка вверх. Еще одна особенность предложена в [1] - полная типизация. Эти функции можно использовать по отдельности или в сочетании друг с другом для повышения производительности системы.
Классификация - самый важный шаг в аутентификации с динамикой нажатия клавиш. Одним из наиболее часто используемых классификаторов является нейронная сеть (NN), где она обучается с использованием выборок временных характеристик, извлеченных из набора текста пользователями. Обученный NN используется позже для проверки заявленного пользователя. В [2] и [3] нейронная сеть была развернута для классификации.
Фактически, некоторые исследователи использовали технику оптимизации для повышения производительности системы за счет уменьшения размеров с помощью анализа главных компонентов (PCA).В [4],
[5] показано, что PCA - это метод линейного преобразования, который менее эффективен для нелинейных данных. Исследователь в [6] показал, что уменьшение размерности с помощью PCA обеспечивает
9,2% ошибочной классификации в зависимости от тестовых выборок нейронной сети.
Схема этого документа выглядит следующим образом: раздел 2 представляет систему аутентификации динамики нажатия клавиш в деталях. Раздел 3 представляет классификатор NN и PCA как методику уменьшения признаков. Раздел 4 представляет предлагаемую систему.Раздел 5 представляет реализацию предложенной системы. Раздел
6 показывает результаты внедрения. Обсуждение и заключение представлены в разделах 7 и 8 соответственно. 2.1 Сбор данных
2.2 Извлечение признаков
• Длительность ключа : также называется «время задержки», количество
раз, когда нажимается клавиша, как показано в следующем уравнении:
PCA с MLP NN выполняется на данных электрической емкостной томографии (ECT), где результаты показали, что использование PCA в качестве уменьшения размерности улучшило производительность оценки MLP и сократило время обучения, в то время как результаты в
NN имеет некоторую ошибочную классификацию при обучении с использованием коррелированных данных, поскольку корреляция вызывает путаницу в NN из-за избыточных данных и ограничивает возможности обобщения обучения NN. 3.2 Анализ основных компонентов как особенность
Метод сокращения
• Down-Down : время отпускания двух последовательных клавиш.
избыточных данных, достаточных для устранения путаницы и увеличения возможности обобщения обучения NN, что приводит к снижению частоты ошибочной классификации. PCA как технология уменьшения размерности -
nique отвечает за преобразование коррелированных переменных в новые некоррелированные переменные, называемые «основной компонент»
• Задержка при обновлении : разница между временем нажатия двух последовательных клавиш.
ненцев »[11].
PCA выполняется путем вычисления ковариации нормированных данных. Собственные векторы и собственные значения вычисляются
из ковариации. Каждый собственный вектор содержит нагрузки характеристик нового компонента. Собственные значения представляют
Другая функция, которую можно использовать как дополнительную, предложена в [1]:
• Всего набирать : общее время, необходимое для ввода всей строки.
важность новых основных компонентов (ПК) с точки зрения дисперсии. Они упорядочены по убыванию. После определения количества значимых компонентов, которые необходимо сохранить в зависимости от собственных значений, оставшиеся собственные векторы представляют матрицу преобразования исходных данных в 2.3 Приближение динамики нажатия клавиш
новая проекция.Его умножают на исходные данные, чтобы получить оставшиеся ПК [12].
Существуют различные способы определения количества значимых компонентов. Один из них - это часть процента дисперсии, которую решили сохранить. Эта часть называется «дисперсия ПК». Например, можно решить сохранить 5% или 10% дисперсии ПК [11].
К алгоритмам динамики нажатия клавиш можно подойти разными способами. Наиболее часто используются методы
на основе: статистических алгоритмов [8] или нейронных сетей [2], [3],
[5] и [6], где сеть обучается с использованием извлеченных функций
и сохраняется в Используется для отнесения заявленного пользователя к
проверке. 3.1 Нейронная сеть как классификатор
MLP - одна из широко используемых сетей NN. Это нейронная сеть прямого распространения
Полученные ПК обладают следующими свойствами: 1-й ПК не коррелирован с другими ПК и коррелирован с большинством исходных функций.2-й ПК не коррелирован с остальными ПК и коррелирован с функциями, которые не показали высокой корреляции с 1-м ПК и так далее для остальных ПК [11].
Иногда, чтобы PCA работала хорошо, данные перед их подачей в PCA выполняются нормализацией. Например, нормализация z-показателя, норма единичного вектора и логарифмическое соотношение [13]. 4.1 Переполнение системы
Когда заявленный пользователь x пытается предоставить доступ к системе 4.2 Сбор данных
элементов векторов признаков, которые имеют длину 38. Характеристики уменьшены так, что минимальный процент дисперсии ПК составляет 5%, что позволит сохранить достаточно ПК для достижения более
80% совокупного процента от общего дисперсия. В результате получается 200 выборок из 5 компонентов вместо 38, которые представляют входные данные для NN. 4.3 Извлечение функций
9 вверх. -Up (UU) задержки, за которым следует время Total Typing (TT), построение одного вектора признаков длиной 38, как показано на рис. 2. 200 выборок векторов признаков сохраняются в базе данных. 4.4 Сокращение функций с помощью PCA
PCA выполняется как в разделе 3.2. Входными данными является 200 sam- 4.5 Построение модели с использованием многослойной нейронной сети персептрона
Сеть
3.
После того, как признаки были нормализованы и уменьшены, они
служат в качестве входных данных для NN с желаемыми целями.Выборки
200 делятся на 80% для обучения сети, 10% на
для проверки, которая используется для остановки сети, и 10% на
для тестирования обученной сети. Нейронная сеть распознавания образов
случайным образом генерирует начальные веса и смещения. Итак, все параметры сети
(входы, цели, начальные веса и смещение -
es) теперь установлены, и сеть готова к обучению. Рис. 4
показывает подробную архитектуру сети. 4.6 Проверка пользователя
Классификация осуществляется путем выполнения двух проверок: проверки достоверности и проверки подлинности соответственно.
• Проверка действительности:
Имена пользователей и пароли извлекаются из базы данных для проверки действительности заявленного пользователя путем сравнения вновь введенного имени пользователя и пароля с теми, которые были извлечены из базы данных. Если имя пользователя и пароль правильный, то позиция этого пользователя в базе данных получается для использования при проверке подлинности.
• Проверка подлинности:
После проверки того, что заявленный пользователь является действительным пользователем и его пароль верен, его вектор сокращенных функций проверяется с использованием обученной сетевой сети. Результатом является вектор оценок пользователей в диапазоне от 0 до 1. Если оценка пользователя, который находится в позиции, полученной на этапе проверки достоверности, равна или превышает предварительно определенный порог ошибки, то пользователь аутентифицируется и предоставляет доступ к система, а если нет, он не аутентифицирован и может повторить попытку.
Порог ошибки выбирается от 0 до 1. Он определяет уровень безопасности системы. Чем выше пороговое значение, тем выше безопасность.
На рис. 5 показан интерфейс предложенной модели, в которой при регистрации пользователь регистрируется, вводя имя пользователя и пароль
длиной 10 и нажимая кнопку Enroll , которая откроет новое окно для извлечения функций из пароля. как показано на рис.6. При нажатии кнопки Save векторы функций сохраняются в базе данных MS Access 2013, а статус, указывающий на успешность процесса, отображается в поле статуса на рис. 5.
После извлечения функций от пользователей, PCA выполняется нажатием кнопки Perform PCA , которая выполняет код MATLAB PCA. Результатом являются уменьшенные функции и сохраненные в файле mat, который будет входить в NN. При нажатии кнопки Learn NN сеть обучается с помощью инструмента MATLAB нейронной сети для распознавания образов и сохраняется также в виде файла mat, который будет использоваться для проверки пользователя.
При проверке заявленный пользователь вводит свое имя пользователя и пароль и нажимает кнопку Проверить на рис. 5, которая извлекает вектор характеристик и проверяет достоверность, используя функцию для получения имен пользователей и паролей из базы данных. и сравнение строк имени пользователя и пароля заявленного пользователя с полученными. После этого проводится проверка подлинности. Если пользователь аутентифицирован, отображается окно сообщения «Пользователь аутентифицирован», если нет, отображается окно сообщения «Пользователь не аутентифицирован». 6.1 Результаты PCA
Рис. 7 показывает, что только первые 5 компонентов имеют отклонения ПК более 5%.Таким образом, результат PCA - это 5 компонентов по 200 выборок в каждом, полученные в результате умножения нормализованных данных на матрицу преобразования размером 38 x 5. 38 - это количество исходных функций, а 5 - количество новых сокращенных компонентов. .00 9203 9203 9203 9203 9203 9203 9203 9203 9203 9203 1 00030003 0003 0003 9202-9203 9202 9203 9202 9203 9202 9202 9203 9203 9202 9202 920 9000 2 - 031 9202
и так далее. 6.2 Результаты NN
на тестовых образцах.
• Путаница между выходами и целями в сети NN
Общее количество ошибок в классификации снизилось с 2% до 1% с развертыванием
PCA. На рис. 8 и 9 показана путаница между выходными данными и целями NN без и с развертыванием PCA
соответственно.
• Производительность MSE
Рис.10 показывает, что лучшая производительность MSE составляет 0,012 в эпоху 33 с развертыванием PCA
, в то время как на рис. 11 показано, что максимальная производительность MSE составляет
, равная 0,0005 в эпоху 22 с развертыванием PCA.
• Время обучения NN
Время, необходимое для обучения NN, снизилось с 0,359 секунды
до 0,224 секунды с развертыванием PCA. На рис. 12 показано время обучения для каждой эпохи без и с развертыванием PCA.
6.3 Результаты проверки
Предлагаемая система оценивается с использованием двух оценок:
• FAR (False Acceptance Rate): оценка неверно аутентифицированных
самозванца.
• FRR (False Rejection Rate): процент ошибочных отклонений аутентичного пользователя
.
• EER (равная частота ошибок): значение, при котором FAR и FRR равны
.
На Рис. 13 и Рис. 14 показаны FAR, FRR и EER с разными порогами ошибок без и с развертыванием PCA соответственно.
порог 0,5. 6.4 Сводка результатов
. В предлагаемой модели пять временных характеристик были извлечены и объединены для использования при проверке пользователем.Этими функциями являются длительность ключа, три задержки (вверх-вниз, вниз-вниз, вверх-вверх) и не очень широко используемая функция до сих пор, а именно полный набор текста.
С точки зрения безопасности использование полного набора текста в качестве дополнительной функции, добавляемой в конец вектора функций, повышает безопасность системы. Полная типизация добавляет несогласованности к вектору признаков из-за его далекой ценности от значений других характеристик. Таким образом, векторы признаков нормализуются, чтобы устранить несоответствие. Несогласованность и нормализация усложняют систему, повышая безопасность.
Что касается точности, как система аутентификации динамики нажатия клавиш, предлагаемая система аутентифицирует пользователя с 6% FAR и 24% FRR. Из таблицы 3 можно заметить, что эти две скорости представляют собой уменьшенные значения по сравнению с системой, не использующей сокращенные функции PCA. Причина, по которой предлагаемая система обеспечивает такую пониженную скорость, заключается в том, что в ней используется PCA для уменьшения временных характеристик. Уменьшение количества функций удаляет избыточные данные, так что результирующие уменьшенные компоненты не коррелируют друг с другом.Некоррелированные данные увеличивают возможности обобщения обучения NN, что приводит к лучшей классификации и меньшему времени обучения, поскольку NN расходится быстрее к желаемому результату, как показано в значении MSE / эпохи в таблице 3. ССЫЛКИ
Понимание разнообразия металлоорганической рамочной экосистемы
развития дескрипторов для химии MOF
Описание баз данных
Прогнозирование адсорбционных свойств MOF
Разнообразие баз данных MOF
Приложения анализа разнообразия