В.А. Дюк, Санкт-Петербургский институт информатики и автоматизации РАН
Приведу отрывки из этой работы, так как автор кратко и понятно описывает достоинства
и недостатки существующих программ "Интеллектуального анализа".
Пусть Вас не пугает словосочетание "Интеллектуального анализа" , оно не значит, что только избранные или интеллектуалы могут пользоваться этими умными программами. Это словосочетание возникло, тогда, когда первые ЭВМ были еще в проект. Любой мозг понимает, что невозможно понять все многообразие природы, как вы не в состоянии понять некоторые поступки своего соседа или соседки. И поэтому все помыслы были направлены на то, чтобы заставить ЭВМ думать, мыслить и решать все задачи которые перед нами ставит природа и обыденная жизнь. Это основная цель всех ученных и программистов. И сейчас, как вы хорошо знаете, японские исследователи успешно решают эту задачу на уровне бытовых роботов. Им удалось сделать роботам интеллект на уровне младенца. В недалеком будущем такие роботы будут давать Вам советы по всем научным, торговым и бытовым вопросам. Этот вывод основан на том, что сейчас уже есть программы., которые весьма неплохо самостоятельно анализируют окружающую обстановку ( в бизнесе, науке, обыденной жизни) и выдают Вам неплохие советы и решения, как выйти из тупиковой ситуации и что готовит недалекое будущие.
К таким программам относятся:
Предметно-ориентированные аналитические системы - Project Expect Audit Expect
1. . Статистические пакеты
Все, начиная со школьников решали элементарные статистические задачи. Поиск доминанты
Как в жизни, так и в бизнесе оценивается процентным превосходством над другими предложениями. И к статистике в настоящее время относятся, как в известном анекдоте « какова средняя температура в больнице»
2. . Нейронные сети
Как только человек узнал о приблизительной структуре мозга, так стал сразу же создавать алгоритмы и программы подражающие работе нейронных сетей в головном мозге. То есть, не вычислять среднюю температуру по больнице, а иметь полное описание каждого больного в больницы (нейрона) и только после этого назначать лечение этому больному. Необходим для этих программ колоссальный и детальнейший обьем данных и ( как и натуральному мозгу) длительный период обучения.
3. Системы рассуждений на основе аналогичных случаев
Вполне понятно, для нашего мозга, который давно подметил, что, то что было в прошлом с большой вероятностью повторяется в будущем. Программа ищет аналогичные ситуации в прошлом и выдает Вам готовые решения, которые тогда были приняты для ее ликвидации.
Но в настоящее время известно, что то решение которое было много лет назад оптимальным, оптимальным уже не будет. Так как , Вам это скажет любой врач, даже больные с аналогичными диагнозами требуют разных методик лечения.
4. Система KnowledgeSeeker обрабатывает банковскую информацию
«Популярность подхода связана как бы с наглядностью и понятностью. Но деревья решений принципиально не способны находить “лучшие” (наиболее полные и точные) правила в данных. Они реализуют наивный принцип последовательного просмотра признаков и “цепляют” фактически осколки настоящих закономерностей, создавая лишь иллюзию логического вывода. ». Этот алгоритм позволяет оценить данного больного в данной больнице и выдать решение о методики его лечения. Но будет ли это решение оптимальным - решать Вам.
5. Эволюционное программирование
Программисты при создании интеллектуальных алгоритмов не могли обойти эволюционную теорию Дарвина. Сама природа развивается эволюционно, и наш мозг подчиняется только природе. Кажется, такой подход безупречен - подражание самой природе.
. «В данной системе гипотезы о виде зависимости целевой переменной от других переменных формулируются в виде программ на некотором внутреннем языке программирования. Процесс построения программ строится как эволюция в мире программ (этим подход немного похож на генетические алгоритмы). Когда система находит программу, более или менее удовлетворительно выражающую искомую зависимость, она начинает вносить в нее небольшие модификации и отбирает среди построенных дочерних программ те, которые повышают точность. Таким образом система "выращивает" несколько генетических линий программ, которые конкурируют между» собой в точности выражения искомой зависимости
Этот алгоритм, оценит каждого больного, и по каждому больному выдаст несколько методик лечения, и все они будут более или мене оптимальны. Так что всю ответственность за выбор лечения берете на себя Вы.
6. . Генетические алгоритмы
Открытие генов и удивление, что в них закодирована вся наша жизнь, привело к созданию генетических алгоритмов.
«Первый шаг при построении генетических алгоритмов — это кодировка исходных логических закономерностей в базе данных, которые именуют хромосомами, а весь набор таких закономерностей называют популяцией хромосом. Далее для реализации концепции отбора вводится способ сопоставления различных хромосом. Популяция обрабатывается с помощью процедур репродукции, изменчивости (мутаций), генетической композиции. Эти процедуры имитируют биологические процессы. Наиболее важные среди них: случайные мутации данных в индивидуальных хромосомах, переходы (кроссинговер) и рекомбинация генетического материала, содержащегося в индивидуальных родительских хромосомах (аналогично гетеросексуальной репродукции), и миграции генов. В ходе работы процедур на каждой стадии эволюции получаются популяции со все более совершенными индивидуумами. »
В этом случае будет проведен сначала анализ всех больных, затем анализ каждого больного, которые «мутируют» и только затем будут выданы решения о лечении и методике лечения.
Вы видите, какое страстное подражание природе, заложено в этих алгоритмах. Но все они настолько интеллектуальны, насколько мы знаем их основу. Мы совершенно не знаем как работает наш мозг и тем более как работает вся нейронная сеть. Мы воспитаны на эволюционной теории Дарвина, которая не раз подтверждалась. Но в развитии биологических видов решающую роль играли микромутациии и мутации, которым нет места в теории.
Мы недавно открыли все гены - подсчитали их количество. Но мы еще бесконечно далеки от понимания их работы.
7. Алгоритмы ограниченного перебора
«Эти алгоритмы вычисляют частоты комбинаций простых логических событий в подгруппах данных. На основании анализа вычисленных частот делается заключение о полезности той или иной комбинации для установления ассоциации в данных, для классификации, прогнозирования и пр. »
«Система WizWhy является на сегодняшний день одним из лидеров на рынке продуктов интеллектуального анализа данных. Это не лишено оснований. Система постоянно демонстрирует более высокие показатели при решении практических задач, чем все остальные алгоритмы. Стоимость системы около $ 4000, количество продаж — 30000. »
Эта система покажет почему два больных с одинаковыми диагнозами выздоравливают по разному. То есть программа выдаст в доступной форме те факторы, которые влияют на лечения каждого индивида.
Так программа легко и просто нашла причину « , объясняющие низкую урожайность некоторых сельскохозяйственных участков »
Чем больше исходных данных, тем больше неожиданных для вас и естественных для бизнеса и природы решений найдет программа:
1 «Данные имеют неограниченный объем
2 Данные являются разнородными (количественными, качественными, текстовыми) «
3 Результаты конкретны и понятны
Область применения этой программы практически не ограничена, как и область природного интеллекта. Используя, эту программу вы получаете быстрое и эффективное решение стоящей перед вами задачи.
Система WizWhy постоянно демонстрирует более высокие показатели при решении практических задач, чем все остальные алгоритмы
Новая версия с stie - http://www.wizsoft.com/default.asp?win=7&winsub=28
Data analyzer and predictor
Syosset, NY – March 13, 2002 – WizSoft, Inc. announced WizWhy version 4, a data-mining software tool for data analysis and for issuing predictions, running under Windows 9x/NT/2000/XP. WizWhy 4 is available for $3,995.00 + shipping and handling.
WizWhy 4 has a number of important advantages and unique features compared to other data mining tools:
Analyzes the data by revealing all the if-then rules in the data.
Points out the main patterns in the data by revealing the necessary and sufficient conditions: if-and-only-if-rules. These rules are optimal since they cover the maximum number of both positive and negative examples.
Lets the user to Manually filter out non-interesting rules.
Analyzes and predicts for a Boolean or multi-value (categorical) or continuous dependent variable. And predicts the expected value(s) of the dependent variable for new cases based on the discovered rules.
Takes the if-and-only-if rules into account on top of the if-then rules when issuing predictions for more accurate results.
Avoids rules representing noise or overfitting to increase the accuracy level of predictions.
Solves cases of rule inconsistency by weighting the rules according to their error probability and the level of unlikelihood, and calculates the prediction in these cases.
Points out unexpected cases in the data where the dependent variable’s value deviates from the value anticipated according to the rules. These anomalies may indicate noise, data entry errors, or fraud in the data set under analysis.
Reveals interesting phenomena in the data by uncovering the unexpected rules; rules having more than one-condition are unexpected when they are improbable according to the one-condition rules and trends.
Summarizes the data graphically by presenting the one-condition rules and the basic trends.
What’s new in WizWhy 4?
1. The user can filter out non-interesting if-then rules.
2. The user can control the building of the if-and-only-if rules.
3. The unexpected cases can be exported to MS Access.
WizWhy 4 has many practical applications where simple or complex data analysis and predictions are required. For instance:
Banks and financial institutions can use WizWhy 4 to indicate risky customers Corporations implementing direct marketing will find that WizWhy 4 is the ideal tool to increase the success rate of a direct mail campaign WizWhy 4 can be useful for financial modeling and trading system development to enhance the trading system WizWhy 4 can assist professionals in the fields of medicine and social sciences to enhance diagnostic and research efforts. WizWhy 4 improves data auditing and fraud detection.
WizWhy 4 directly reads ASCII, dbf, MS Access, MS SQL and Oracle data sets, and through ODBC and OLE DB.
WizSoft Inc. develops, licenses and supports software products based on mathematical algorithms for the business sector including, data mining tools, accounting and inventory management, operations research, computational linguistics, and biometrics. WizSoft Inc. is a wholly owned subsidiary of WizSoft Ltd. with headquarters in Tel-Aviv, Israel.
To receive a free CD demo: a fully functional product limited to work with 1,000 records, call (516) 393-5841 or download it from WizWhy-Download Demo.
WizWhy single license ....................... US$ 3,995.00
WizRule single license ........................ US$ 1,395.00
WizSame single license ...................... US$ 2,495.00
Примерная стоимость посылки программного обеспечения
one S/W package ............................ US $50
two S/W packages ............................ US $80
three S/W packages ........................... US $120
Связь:
Телефон 87772398091
Skype - geogu55