Week 2 #127

AlexeyRyabchikov · 2025-02-28T12:40:35Z

No description provided.

spajic

Approve, nice work, хорошо, что использовали фидбек от 1го ДЗ и хорошо, что поделали итераций до переделывания на потоковую работу 👍

spajic · 2025-03-02T21:26:12Z

case-study.md

+
+## Формирование метрики
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику: программа не должна потреблять больше **70Мб** памяти при обработке файла `data_large.txt` в течение всей своей работы.
+(Учел ошибку первой домашней работы и сделал объем данных больше, для того чтобы проблемы были более очевидны на частичных файлах от основного)


spajic · 2025-03-02T21:26:29Z

case-study.md

+Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.
+
+## Feedback-Loop
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за 15-20 секунд.


spajic · 2025-03-02T21:27:33Z

case-study.md

+   Строка 103:
+   user_sessions = sessions.select { |session| session['user_id'] == user['id'] }
+```
+- Как и в первой домашней работе заменил перебор всех сессий на хэш с группированные данных по user_id. В данном конкретном месте алгоритмическая сложность с O(n) изменилась на O(1).


spajic · 2025-03-02T21:29:29Z

case-study.md

+   
+   Строка 139:
+   collect_stats_from_users(report, users_objects) do |user|
+     { 'dates' => user.sessions.map{|s| s['date']}.map {|d| Date.parse(d)}.sort.reverse.map { |d| d.iso8601 } }


строка кстати избыточно плотная, тут и map 3 раза, ещё sort, ещё reverse, ещё Date.parse,...

для более понятных отчётов в таких случаях можно просто отформатировать на несколько строчек это

spajic · 2025-03-02T21:30:24Z

case-study.md

+
+## Результаты
+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с 131 MB при выполнении 20_000к строк и 226 MB при выполнении 40_000к строк в начале, до ~38 мБ на файле `data_large.txt` и уложиться в заданный бюджет.


spajic · 2025-03-02T21:31:12Z

task-2.rb

-    @sessions = sessions
-  end
+def parse_line(line)
+  type, id, *params = line.split(',')


что-то я подозреваю, что *params может подтормаживать по сравнению с явным указанием переменных (не критично, просто заметка)

aleksey.ryabchikov added 5 commits February 26, 2025 12:50

loop_1

a97bcda

loop_2

29afa0e

loop_3

edd51ee

loop_4

438799d

last_loop

1baf3d6

AlexeyRyabchikov force-pushed the week_2 branch from ad2f3be to 1baf3d6 Compare February 28, 2025 12:45

spajic approved these changes Mar 2, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Week 2 #127

Week 2 #127

Uh oh!

AlexeyRyabchikov commented Feb 28, 2025

Uh oh!

spajic left a comment

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

spajic Mar 2, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants

Week 2 #127

Are you sure you want to change the base?

Week 2 #127

Uh oh!

Conversation

AlexeyRyabchikov commented Feb 28, 2025

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

spajic Mar 2, 2025

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants