Preview

Мехатроника, автоматизация, управление

Расширенный поиск

Синтез системы разрешения коллизий для группы роботов в парадигме обучения без учителя

https://doi.org/10.17587/mau.21.420-427

Аннотация

Групповое взаимодействие роботов без коллизий является актуальной задачей в области робототехники и интеллектуальных систем управления. Предлагается новый подход к решению проблемы избегания коллизий в постановке задачи синтеза оптимальной системы управления с минимально доступной информацией. Предполагается, что роботы имеют некоторую область видимости. Если статические или динамические фазовые ограничения находятся в области видимости робота, то он может реагировать на них. По условию считается, что группа гомогенная, а система управления для достижения терминального состояния уже находится на борту роботов. Искомая система управления для разрешения коллизий отвечает за управление роботом во время нахождения ближайшего соседа в области видимости робота. В данной работе рассматривается совместное решение задачи уклонения от столкновения для двух роботов посредством одного блока управления без назначения приоритетов. Задача решается в условиях полного отсутствия информации о среде и текущем состоянии других роботов в каждый момент времени. Роботы способны лишь определить координаты ближайших соседей, за исключением угла поворота, если те находятся в области видимости рассматриваемого робота.

Описан вычислительный эксперимент с группой мобильных роботов в качестве объектов управления. В качестве аппроксиматора функции управления по состоянию была взята полносвязная искусственная нейронная сеть типа многослойный персептрон. Оптимизация весов персептрона осуществлялась в парадигме обучения без учителя, методом эволюционных стратегий. Выборка сценариев, на которой проводилась оптимизация, генерировалась случайно, в начале итерации по поколениям, в то время как качество полученных весов оценивалось на фиксированной тестовой выборке сценариев.

Результаты эксперимента подтверждают способность найденного персептрона отображать относительное состояние двух мобильных роботов в оптимальное управление, которое позволяет уйти от столкновения, что подтверждают приведенные графики из экспериментальной части.

Об авторе

А. В. Доценко
Российский университет дружбы народов
Россия

Аспирант

Департамент механики и мехатроники Инженерной академии РУДН



Список литературы

1. LaValle S. M., Hutchinson S. A. Optimal Motion Planning for Multiple Robots Having Independent Goals // IEEETrans. on Robotics and Automation. 1998. 14(6). P. 912—925.

2. Barraquand J., Latombe J. C. Robot motion planning: A distributed representation approach // The International Journal of Robotics Research. 1991. Vol. 10, N. 6. P. 628—649.

3. Barraquand J., Latombe J. C. Controllability of Mobile Robots with Kinematic Constraints // STANFORD UNIV CA DEPT OF COMPUTER SCIENCE. 1990. N. STAN-CS-90-1317.

4. Brooks R. A., Lozano-Perez T. A subdivision algorithm in configuration space for findpath with rotation // IEEE Transactions on Systems, Man, and Cybernetics. 1985. N. 2. P. 224—233.

5. Faverjon B. Object level programming of industrial robots // Proceedings, 1986 IEEE International Conference on Robotics and Automation, IEEE. 1986. Vol. 3. P. 1406—1412.

6. Faverjon B., Tournassoud P. A local based approach for path planning of manipulators with a high number of degrees of freedom //Proceedings. 1987 IEEE International Conference on Robotics and Automation, IEEE. 1987. Vol. 4. P. 1152—1159.

7. Barraquand J., Langlois B., Latombe J. C. Robot motion planning with many degrees of freedom and dynamic constraints // The fifth international symposium on Robotics research. 1991. P. 435—444.

8. Zhu D., Latombe J. C. New heuristic algorithms for efficient hierarchical path planning // STANFORD UNIV CA DEPT OF COMPUTER SCIENCE. 1989. N. STAN-CS-89-1279.

9. Parsons D., Canny J. A motion planner for multiple mobile robots // Proceedings., IEEE International Conference on Robotics and Automation, IEEE. 1990. P. 8—13.

10. LaValle S. M. Planning algorithms. Cambridge university press, 2006.

11. Sanchez G., Latombe J. C. Using a PRM planner to compare centralized and decoupled planning for multi-robot systems // Proceedings 2002 IEEE International Conference on Robotics and Automation (Cat. No. 02CH37292), IEEE. 2002. Vol. 2. P. 2112—2119.

12. Oh J. H., Park J. H., Lim J. T. Centralized decoupled path planning algorithm for multiple robots using the temporary goal configurations // 2011 Third International Conference on Computational Intelligence, Modelling and Simulation. IEEE. 2011. P. 206—209.

13. Van Den Berg J., Snoeyink J., Lin M. C., Manocha D. Centralized path planning for multiple robots: Optimal decoupling into sequential plans // Robotics: Science and systems. 2009. Vol. 2, N. 2(5). P. 2—3.

14. Devasia S., Iamratanakul D., Chatterji G., Meyer G. Decoupled conflict-resolution procedures for decentralized air traffic control // IEEE Transactions on intelligent transportation systems. 2011. Vol. 12, N. 2. P. 422—437.

15. Ермолов И. Л., Илюхин Ю. В., Собольников С. А. Планирование траекторий движения в группе автономных мобильных коммуникационных роботов //Вестник МГТУ Станкин. 2012. № 4. С. 96—100.

16. O’Donnell P. A., Lozano-Pérez T. Deadlock-free and collision-free coordination of two robot manipulators // ICRA. 1989. Vol. 89. P. 484—489.

17. Griswold N. C., Eem J. Control for mobile robots in the presence of moving objects //IEEE Transactions on Robotics and Automation. 1990. Vol. 6, N. 2. P. 263—268.

18. Pan T. J., Luo R. C. Motion planning for mobile robots in a dynamic environment with moving obstacles // Proceedings, IEEE International Conference on Robotics and Automation, IEEE. 1990. P. 578—583.

19. Rude M. Collision avoidance by using space-time representations of motion processes //Autonomous Robots. 1997, vol. 4, no. 1. P. 101—119.

20. Erdmann M., Lozano-Perez T. On multiple moving objects //Algorithmica. 1987. Vol. 2, N. 1—4. P. 477.

21. Bennewitz M., Burgard W., Thrun S. Finding and optimizing solvable priority schemes for decoupled path planning techniques for teams of mobile robots // Robotics and autonomous systems. 2002. Vol. 41, N. 2—3. P. 89—99.

22. Clark C. M., Bretl T., Rock S. Applying kinodynamic randomized motion planning with a dynamic priority system to multi-robot space systems // Proceedings, IEEE Aerospace Conference, IEEE. 2002. Vol. 7. P. 7.

23. Grossman D. D. Traffic control of multiple robot vehicles // IEEE Journal on Robotics and Automation. 1988. Vol. 4, N. 5. P. 491—497.

24. Lumelsky V. J., Harinarayan K. R. Decentralized motion planning for multiple mobile robots: The cocktail party model // Autonomous Robots. 1997. Vol. 4, N. 1. P. 121—135.

25. Wang J., Beni G. Distributed computing problems in cellular robotic systems // EEE International Workshop on Intelligent Robots and Systems, Towards a New Frontier of Applications, IEEE. 1990. P. 819—826.

26. Kato S., Nishiyama S., Takeno J. Coordinating mobile robots by applying traffic rules // Proceedings of the IEEE/RSJ International Conference on Intelligent Robots and Systems, IEEE. 1992. Vol. 3. P. 1535—1541.

27. Koren Y., Borenstein J. Potential field methods and their inherent limitations for mobile robot navigation // ICRA. 1991. Vol. 2. P. 1398—1404.

28. Kapadia M., Singh S., Hewlett W., Reinman G., Faloutsos P. Parallelized egocentric fields for autonomous navigation // The Visual Computer. 2012. Vol. 28, N. 12. P. 1209—1227.

29. Wang L., Li Z., Wen C., He R., Guo F. Reciprocal Collision Avoidance for Nonholonomic Mobile Robots // 2018 15th International Conference on Control, Automation, Robotics and Vision (ICARCV). IEEE. 2018. P. 371—376.

30. Huang X., Zhou L., Guan Z., Li Z., Wen C., He, R. Generalized Reciprocal Collision Avoidance for Non-holonomic Robots // 2019 14th IEEE Conference on Industrial Electronics and Applications (ICIEA). IEEE. 2019. P. 1623—1628.

31. Long P., Liu W., Pan J. Deep-learned collision avoidance policy for distributed multiagent navigation // IEEE Robotics and Automation Letters. 2017. Vol. 2, N. 2. P. 656—663.

32. Matarić M. J. Reinforcement learning in the multi-robot domain // Robot colonies. Springer, Boston, MA, 1997.P. 73—83.

33. Stone P., Veloso M. Multiagent systems: A survey from a machine learning perspective // Autonomous Robots. 2000. Vol. 8, N. 3. P. 345—383.

34. Yang E., Gu D. Multiagent reinforcement learning for multi-robot systems: A survey. tech. rep, 2004.

35. Panait L., Luke S. Cooperative multi-agent learning: The state of the art // Autonomous agents and multi-agent systems. 2005. Vol. 11, N. 3. P. 387—434.

36. Godoy J. E., Karamouzas I., Guy S. J., Gini M. Adaptive learning for multi-agent navigation // Proceedings of the 2015 International Conference on Autonomous Agents and Multiagent Systems. 2015. P. 1577—1585.

37. Kretzschmar H., Spies M., Sprunk C., Burgard W. Socially compliant mobile robot navigation via inverse reinforcement learning // The International Journal of Robotics Research. 2016. Vol. 35, N. 11. P. 1289—1307.

38. Dotsenko A., Diveev A., Cevallos J. P. C. Collision avoidance at swarm regrouping using modified network operator method with various number of arguments // 2019 14th IEEE Conference on Industrial Electronics and Applications (ICIEA), IEEE. 2019. P. 768—773.

39. Glorot X., Bengio Y. Understanding the difficulty of training deep feedforward neural networks // Proceedings of the thirteenth international conference on artificial intelligence and statistics. 2010. P. 249—256.

40. Salimans T., Ho J., Chen X., Sidor, S., Sutskever I. Evolution strategies as a scalable alternative to reinforcement learning // arXiv preprint arXiv:1703.03864, 2017.

41. Brockhoff D., Auger A., Hansen N., Arnold D. V., Hohm T. Mirrored sampling and sequential selection for evolution strategies // International Conference on Parallel Problem Solving from Nature. Springer, Berlin, Heidelberg. 2010. P. 11—21.

42. Wierstra D., Schaul T., Glasmachers T., Sun Y., Peters J., Schmidhuber J. Natural evolution strategies // The Journal of Machine Learning Research, 2014. Vol. 15, N. 1. P. 949—980.


Рецензия

Для цитирования:


Доценко А.В. Синтез системы разрешения коллизий для группы роботов в парадигме обучения без учителя. Мехатроника, автоматизация, управление. 2020;21(7):420-427. https://doi.org/10.17587/mau.21.420-427

For citation:


Dotsenko A.V. Collision Avoidance System Synthesis for a Group of Robots in Unsupervised Learning Paradigm. Mekhatronika, Avtomatizatsiya, Upravlenie. 2020;21(7):420-427. (In Russ.) https://doi.org/10.17587/mau.21.420-427

Просмотров: 410


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1684-6427 (Print)
ISSN 2619-1253 (Online)