Вопросы из теста по большим данным

1 Отметьте основные принципы организации данных в витринах данных. Изоляция витрин данных на уровне предоставления прав доступа на чтение определенному кругу ролей
2. Выберите верные утверждения, относящиеся к понятию неструктурированные данные:Не имеет предопределённой организации и имеет множество форм Имеет большое количество различных форматов данных Хранят в озёрах данных, файловых базы данных
3.Какой тип данных используется для хранения аудиофайлов? blob
4.Задачи бизнес-аналитики:
Изучение и формализация предметной области клиента.
Оптимизация бизнес-процессов.
Разработка характеристик IT продукта.
Внедрение новых характеристик продукта.
Расчет метрик качества принятия решений.
Аналитическая отчетность и визуализация.
5.Какие задачи решает аналитика данных? Описание существующих зависимостей и обогащение описательной базы существующих взаимосвязей между измеряемыми показателями у объектов предметной области.
Получение новых знаний о предметной области исходя из данных, отражающих реализацию конкретного бизнес-процесса, на основе методов обработки данных.
6. совокупность данных, хранящихся и упорядоченных в соответствии с определенной структурой. база данных
7. Какой протокол используется для передачи данных между распределенными приложениями на Linux-серверах? ssh
8.В каких задачах не применяются регулярные выражения? Детекция объектов на изображении
9. Среди шкал выберите те, в которых мерой среднего может служить медиана: порядковая интервальная
10. Какие операции можно выполнять с таблицами в реляционной модели данных? все
11. Упорядочивание записей в таблице по строковой переменной осуществляется по правилу: Лексикографическое правило в соответствии с положением слова в словаре
12.Для каких типов данных НЕ имеет смысл выбор показателя в качестве группы при проведении агрегации данных (группировка)? Вещественный тип данных непрерывного признака
13. Какой тип данных используется для хранения URL адресов? VARCHAR
14.Выберите верные свойства, присущие распреден совместная обработка данных: обнаружение отклоов масштабируемость по программным и аппаратным ресурсам
15.столбец, значения которого выбираются за уникальные сущности в пределах которого считается агрегированный показатель. группа
16. С помощью каких ключевых технологий и архитектурных решений достигается высокая скорость записи и чтения больших файлов в серверных решениях на базе кластерной архитектуры? Репликация блоков данных. Последовательная обработка данных. Распределенная система обработки данных.
17.Какое ключевое слово SQL запроса позволяет определить перечень полей по которым происходит группировка данных с помощью агрегационных функций? GROUP BY
18.Процесс загрузки данных в долговременное хранилище данных заключается в:Переносе данных из промежуточных таблиц, образованных на стадии предобработки данных, в структуры хранилища данных.
19.данные являются значениями признака, общее число которых конечно или бесконечно, но может быть подсчитано при помощи натуральных чисел. Дискретные
20. развитие подразумевает собой балансировку нагрузки системы, увеличение количества ресурсов для обработки данных, репликация баз данных, мониторинг и автоматическое отслеживание производительности компонентов системы. Реляционное
21. развитие подразумевает собой уменьшение расходов для платформ и/или продуктов по средствам, времени и качеству решения задачи. Экстенсивное
22. Выберите пример правильно составленного запроса с использованием агрегирующей функции SUM: SELECT SUM(price) FROM Orders;
23.Какие особенности реляционных баз данных? все
24.В формате данных JSON данные хранятся в виде: Коллекции данных формата “ключ-значение”, где доступ к значениям полей данных осуществляется по ключу.
25. Выберите верные свойства, присущие распределённой системе обработки и хранения данных: Совместное использование ресурсов
Обнаружение отказов
Совместная обработка данных
Масштабируемость по программным и аппаратным ресурсам
26.В чем состоят основные отличия ETL от ELT процессов?Реализация стадии предобработĸи данных перед загрузĸой в долговременное хранилище данных для струĸтуризации информации.
27.определяет как и каким образом данные будут располагаться в БД и как к ним будет предоставляться доступ. Модель данных
28.специализированные колоночные РСУБД, оптимизированные для быстрой выборки данных из витрин. Аналитические базы данных
29. Какими свойствами должно обладать хранилище данных?Поддержка изменений во времени
Предметная ориентированность
Консолидированность
30.Существует два вида обогащения данных, а именно ___ обогащение данных - получение отсутствующей информации путём обработки уже имеющихся данных, а также ___ обогащение данных - получение отсутствующей информации из иных информационных систем. Локальное
Внешнее
31.табличных данных - преобразование, упорядочивающее набор объектов (строк) или наблюдений в связи с правилом упорядочивания по выбранным атрибутам. Сортировка
32.часть хранилища данных, секционированная для отделов или направлений бизнеса (например, продажи, маркетинг или финансы). витрина данных
33.Среди шкал выберите те, в которых мерой среднего может служить среднее арифметическое:Интервальная шкала (разностей).
34.Упорядочивание записей в таблице по строковой переменной осуществляется по правилу:Леĸсиĸографичесĸое правило в соответствии с положением слова в словаре.
35.Какое ключевое слово SQL запроса позволяет упорядочить строки в соответствии со значениями в выбранных полях? order by
36/данных — это процесс дополнения сырых данных той информацией, которая в исходном виде в них отсутствует, но необходима для качественного анализа.
37.Выберите верные стадии ETL процесса, расположите их в верном порядке следования. Запишите число без пробелов, состоящее из цифр последовательности. 341256
38.Свойства распределенной системы: совместное использование ресурсов;
совместная обработка;
масштабируемость;
обнаружение отказов;
прозрачность.
39.Какие возможности предоставляет система управления базами данных? все
40.Аналитические базы данных - специализированные _ РСУБД оптимизированные для быстрой выборки данных из витрин. колоночные
41.группа операторов определения, манипуляции данных, переводящих базу данных из одного согласованного состояния в другое согласованное состояние. транзакция
42.Какие задачи решает агрегация (группировка) данных? Подсчет агрегационных функций (статистик) по подвыборкам показателей по группам совпадающих дискретных признаков.
43.Выберите задачи, решаемые с помощью машинного и глубокого обучения с приемлемым качеством: Прогнозирование уровни осадкон на следуниций день на основе историнеския численныя показателей инфосферы в конкретной точке Земного шара.
Поиск именованных сущностей, истольтуемних текстовых сообщениих на естественном намке.
44.система - это совокупность компьютеров, которые обмениваются данными и синхронизируются в общей сети, образуя «единый компьютер» для конечного пользователя. распределённая
45.данных - операция выборки строк (объектов) или наблюдений из таблицы данных в соответствии с логическим правилом сравнения значений выбранного атрибута с
определенным значением. фильтрация
46. Какие существуют основные свойства шкал измерений?Идентифицируемость.
Абсолютный ноль.
Величина.
Равенство интервалов.
47.На каких стадиях обработки данных применяются методы трансформации данных? Стадия подготовки данных перед загрузкой данных в хранилище.
Организация витрин данных.
Оптимизиация данных для проведения моделирования.
48.Расположите стадии проведения аналитики данных в правильном порядке 25143678
49.В чем состоит существенная особенность временных рядов как данных табличного типа?Содержат зависимые упорядоченные во времени последовательности значений.
50.таблицы (должна быть: данных) в обработке и хранении данных это перечень полей и их типов данных, которыми представлена таблица данных. структура
51.Сопоставьте ĸомпоненты ĸонвейера обработĸи данных с их фунĸциями. 2465
52.Выберите верные утверждения об аналитических базах данных: Предназначены такие БД для обработки данных на стадии работы непосредственно с витринами больших данных.
Основаны на системах массивных параллельных вычислений (МРР) и базах данных, поддерживающих такой режим работы.
53. Для чего необходимо ведение журналов транзакций транзакционными системами РСУБД? Поддержка целостности данных.
Журналирования запросов
Восстановление реляционной БД
54. Выберите корректный пример использования функции CONCAT:
SELECT CONCAT (‘index’," ",‘city’) FROM Orders
55.совокупность компьютеров которые обмениваются данными и синхронизируются в общей сети, образуя “единый компьютер” для конечного пользователя.Кластерная система
56.Какие факторы ограничивают повышение производительности в решениях на базе распределенных архитектур? все
57.базы данных - список таблиц, их атрибутов, типов данных, ограничений, ключей и связей между таблицами, необходимый для корректной организации хранения данных в памяти вычислительного устройства и доступа к данным извне, как на запись, так и на чтение. схема

58.Возможно ли использование одновременно двух агрегирующих функций SELECT MIN(price), MAX(price) FROM Orders?Да, в результате мы получим минимальную и максимальную стоимости.

1 Like