Новая система, спроектированная для вычислений тензорной алгебры, может снабдить увеличение скорости в 100 раз сравнивая с компьютерныйми пакетами, использовавшимися до этого. Учёные из Массачусетского технического факультета (Massachusetts Institute of Technology) сделали свежую платформу, которая автоматом возбуждает код, улучшенн для редких данных. Данный процесс ведёт к ускорению обработки огромных массивов информации.
cloudnewsdaily.com
Для теста огромных данных нужен целый комплекс действий. Предположим, что торговый сетевой источник, к примеру, Amazon, захочет сравнить любого собственного заказчика с каждым показанным продуктом, установив «1», если продукт был приобретен, и «0» иначе. Итогом будет неописуемо грандиозная матрица данных, преимущественно заключающаяся из нулей. Это то, как говориться редкими данными. Когда такие данные обрабатываются, метод теста принужден регулярно укладывать нули и множить их. Это явная потеря ресурсов: и времени, и производительности ПК.
Последнее изучение MIT создается вокруг нового компьютерного продукта, автоматом формирующего код, улучшенн под редкие данные. Технологию, которая это делает, представили Taco по аббревиатуре для компилятора тензорной алгебры (tensor algebra compiler). Аксиатор — это трехмерный пример матрицы, но данные, которые нужно обработать, как правило лежат в матрицах. Отдачей способ должен точным операциям, проводимым на тензорах, они работают стремительней, чем подобные процедуры с матрицами, если любой очередности тензорных операций выделено свое «ядро» (стандарт расчёта).
Чтобы осуществить данную технологию, нужно было признать значимость теста огромных данных. При запуске Taco разработчик программного обеспечения показывает объем тензора — общего либо редкого — и размещение документа с данными, которые нужно обработать. В работе Taco применяет действенный механизм индексирования, чтобы держать лишь ненулевые значения редких тензоров. Для аналогии, массив информации с Amazon с свежими значениями будет иметь приблизительно 107 экзабайт, однако с технологией сжатия Taco он кредитёт всего 13 килобайт, которые можно обработать очень оперативно.
Данная разработка увлекательна многим бизнесам и вузам. Тест огромных данных дает возможность ученым и платным экспертам быть информированными об интересующих их действиях лучше и стремительней принимать действенные решения, отбрасывая не нужные либо применяемые данные. Используя трудные технологии теста, такие как тест текста, механическое изучение, сбор данных, возведение сценариев, обработку статистики, будет вероятно сосредотачиваться на свежих, раньше незамеченных источниках данных, и грамотнее тратить собственные источники.