ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ ФОРМУВАННЯ НАБОРІВ ВХІДНИХ ТЕСТОВИХ ДАНИХ

23.08.2023 14:29

[1. Information systems and technologies]

Author: Бердник Михайло Геннадійович, доктор технічних наук, Національний технічний університет «Дніпровська політехніка»; Захаров Дмитро Ігорович, аспірант, Національний технічний університет «Дніпровська політехніка»; Стародубський Ігор Петрович, аспірант, Національний технічний університет «Дніпровська політехніка»

ORCID: 0000-0003-4894-8995 Бердник М.Г.

Одним із найважливіших кроків при розробці програмних продуктів є тестування. Важливими цілями тестування є відповідність розробленої програми заданим вимогам, дотримання логіки у процесах обробки даних та отримання вірних кінцевих результатів. Тому для тестування дуже важливо згенерувати вхідні дані, на основі яких програма перевірятиметься на наявність помилок та відповідність заданим вимогам. Для тестування деяких програм може йти до 50% усіх тимчасових витрат.

Однією з основних цілей тестування є створення такого тестового набору, який би забезпечував достатній рівень якості кінцевого продукту за рахунок перевірки більшості різних шляхів програмного коду, тобто забезпечував би його максимальне покриття. Однією з локальних завдань, вирішуваних для пошуку тестового набору, є визначення одного, найскладнішого шляху коду.

Генерація тестових даних – складний та трудомісткий процес, що потребує великих зусиль. Тому автоматизація цього процесу, хоча б часткова, є актуальним дослідницьким завданням, вирішення якої могло б підвищити ефективність тестування програмного забезпечення. Однією з цілей автоматичної генерації тестових даних є створення такої множини тестових наборів, яка б забезпечила достатній рівень якості кінцевого продукту шляхом перевірки більшої частини різних шляхів коду, тобто забезпечила б максимальне покриття коду у відповідність до обраних критеріїв оптимальності (наприклад, критерії покриття операторів або гілок). Підібрати такі набори даних вручну є трудомістким завданням, у роботі пропонується автоматизація цього процесу з допомогою генетичного алгоритму. У роботі використовується динамічний підхід до генерації даних, який ґрунтується на фактичному виконанні коду та динамічному аналізі потоку даних.

Одним із способів візуалізації коду є граф потоків управління (ГПУ), який визначається як спрямований граф СГ = (V, R, v_int, v_out), де V - набір вузлів графа, R - підмножина декартового добутку V×V, яке визначає бінарне відношення на V (множина ребер графа), v_int, v_out – вхідний та вихідний вузли, відповідно, v_intє V, v_outє V. Ребро (гілка) графа (v_i, v_J) відповідає можливій передачі управління від вузла до v_i вузла v_J . Кожна гілка може бути позначена предикатом, що визначає умови, за яких ця гілка буде пройдена при черговому запуску програми. Використання графа потоків управління дозволяє визначити шлях, яким пройшли обчислення при виборі відповідного тестового набору.

Таким чином, можно визначити шлях P в графе, який є набором вузлів P = (v_int, v_il,..., v_ij,...,v_out) , таких що ( v_ij, v_ij+1)є R .

Тестовий набір x_i ініціює проходження певним шляхом P_i , тобто можна говорити, що тестові набори дозволяють забезпечити покриття певних вузлів графа, розташованих на даному шляху.

Визначимо (u₁, u₂...u_n) – вектор вхідних змінних тестованого коду; область визначення вхідних змінних Ω = Ω₁×Ω₂, ...×Ω_n , де Ω_i – область визначення вхідної змінної u_i. Шлях P досягнутий, якщо існує вхідний тестовий набір, що призводить до проходження потоку керування цим шляхом, в іншому випадку шлях P недосяжний. Мета генерації даних - знайти безліч тестових наборів (x₁, x₂...x_k), x_i є Ω_i, що ініціюють проходження по заданій безлічі досяжних шляхів. Як критерій якості тестового набору можна використовувати функцію, яка задає ненульові ваги тим вузлам графа, по яких проходить шлях P:

де w_i(x)– ненульові ваги, що відповідають шляху P та вхідному вектору x_i є Ω_i; n(x) – кількість операторів на аналізованому шляху.

Розглянемо формальну постановку задачі генерації тестових даних та її розв'язання з допомогою генетичного алгоритму (ГА). Відповідно до термінології ГА визначимо популяцію особин, що складається з k хромосом (x₁, x₂...x_k), де кожна хромосома x_i=(uⁱ₁, uⁱ₂...uⁱ_n) відповідає одному набору тестових даних, складається з n генів (значень n вхідних змінних). Основний цикл ГА виконуються ітераційно до досягнення максимально можливого покриття або заданої кількості поколінь:

1. Ініціалізація. Вихідна популяція формується випадковим чином з урахуванням обмежень на значення вхідних змінних. Обсяг популяції k вибирається на основі розміру програми, що тестується.

2. Оцінка популяції. Кожна хромосома популяції оцінюється функцією пристосованості (наприклад, функцією (1) у разі потреби покриття заданого шляху P).

3. Селекція (відбір). Кращі 20% хромосом відбираються у незмінному вигляді для наступного покоління; решта 80% хромосом наступного покоління будуть отримані в результаті схрещування. Ця пропорція отримана емпірично і дозволяє забезпечити достатню різноманітність популяції з високою швидкістю збіжності.

4. Схрещування. Половина особин наступного покоління формується шляхом випадкового схрещування 20% найкращих хромосом попереднього покоління один з одним. Інші хромосоми будуть отримані шляхом випадкового схрещування всіх хромосом попереднього покоління один з одним.

5. Мутація. Із заданою ймовірністю мутації (0.05) кожен ген може змінити своє значення на випадкове у межах заданих обмежень на вхідні змінні. Основна мета мутації – досягнення більшого розмаїття.

6. Формування тестових наборів даних у вигляді пулу елітних хромосом. У кожному поколінні відбувається відбір особин популяції в пул елітних хромосом, що забезпечують додаткове покриття коду, порівняно з попереднім покриттям. Обчислення ваги у функції пристосованості (1) може бути проведено з використанням різних метрик складності коду.

Завдання полягає у максимізації цільової функції, тобто F(X) →max.. Використання генетичних алгоритмів дозволяє порівнювати безліч різних варіантів даних для тестування програми. Широкі можливості до удосконалення дозволяє збільшити кількість початкових тестових варіантів, кількість поколінь та додати нові властивості, завдяки яким можна суттєво збільшити можливості знаходження більш відповідних варіантів. Якщо відстежувати пройдені графи і знижувати ваги тих графів, які найчастіше зустрічаються в різних варіантах, можна забезпечити пошук нових шляхів, які на даний момент можуть не траплятися, але можуть бути важливими не менше, ніж ті, що найчастіше зустрічаються.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

Сonferences

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ ФОРМУВАННЯ НАБОРІВ ВХІДНИХ ТЕСТОВИХ ДАНИХ

Another articles in this section