Ubezpieczenie od jazdy na gapę

Mój przyjaciel, dr Paweł Prociów, zaproponował dzisiaj taki oto pomysł na startup: ubezpieczenie od kontroli biletów.
Pasażer wykupuje abonament i nie kupuje biletu, a ewentualne kary płaci za niego ubezpieczyciel.
Pytanie czy mogłoby ono być tańsze od biletu i czy MPK mogłoby się opłacać nie walczyć z tym startupem?
Pierwsze pytanie wydaje mi się równoważne pytaniu, czy może być tak, że wartość oczekiwana kary przy jechaniu na gapę jest niższa niż cena biletu.
(Przez "może być", mam na myśli długotrwałą i opłacalną strategię cenową ze strony MPK)
Drugie pytanie wydaje mi się jeszcze bardziej skomplikowane.
Zacznijmy więc od czegoś prostszego: jak w zasadzie MPK powinno ustalać cennik, regulamin i liczbę kontroli?

Ten post jest długi i nie dochodzę w nim do odpowiedzi, bo się na tym nie znam i dopiero uczę.
Ten post to raczej zapis moich przemyśleń i gorące zaproszenie do dyskusji, z której mam nadzieję się wiele nauczyć.

Zakładam, że pewne rzeczy są niezmienne:

P = liczba podróży dziennie
t = średni koszt jednej podróży
T(P) = t*P = koszt transportu wszystkich podróży (oprócz kontroli)
k = koszt skontrolowania jednego pasażera podczas jednej podróży

Założenie, że liczba podróży dziennie jest niezależna od cen biletów itd. jest raczej nierealne, w praktyce przecież ludzie mogą zacząć rezygnować z MPK,
gdy im się to nie opłaca. To trzeba będzie zmienić, ale na razie niech tak zostanie.
Założenie, że T(P) jest liniową funkcją P, może też być nieprawdziwe, bo np. oznacza, że firma nie ma kosztów stałych i że każdy kolejny autobus i kierowca
kosztują tyle samo, ale dopóki zakładamy, że P jest stałe, to kształt tej funkcji można olać, bo i tak patrzymy tylko na jej jedną wartość: T(P).
Założenie, że k jest stałe, oznacza, że zakładam m.in. że organizacja kontrolerów jest bardzo efektywna (np. dbają o to by losowo dzielić się trasami i nie potrzebują kadry menadżerskiej) i że bez trudu można ich zrekrutować. Tego raczej nie będę ruszał.
To oczywiście nierealistyczne założenia, ale od czegoś muszę zacząć, jak uda mi się przy takim prostym modelu, to zacznę go komplikować.

Chcemy ustalić następujące zmienne:

G = liczba między 0 a P sytuacji, gdy ktoś pojechał na gapę
S = liczba dokonanych kontroli
f = wysokość kary za jechanie bez biletu
b = cena biletu

Pierwszą intuicję mam taką, że żeby kontrola się opłacała to jej koszt nie może przekraczać oczekiwanego zysku.
Kontrola może się zakończyć naliczeniem kary o wysokości f w G na P przypadków.
Zakładam na razie, że to faktycznie jest z punktu widzenia kontrolera zmienna losowa o prawdopodobieństwie G/P,
tzn. że kontroler nie umie w żaden sposób a priori stwierdzić na jakiej linii, o jakiej porze i kogo warto kontrolować.
Czyli oczekiwany zysk z kontroli to f*G/P, tymczasem jej koszt to k.
Ta pierwsza intuicja zdaje się prowadzić do konkluzji, że kontrola to coś co albo się opłaca albo nie.
Kontrola zdaje się opłacać wtedy i tylko wtedy gdy k < f*G/P.
Jeśli się nie opłaca to po co w ogóle robić kontrole (S=0), a jeśli się opłaca, to skontrolujmy wszystkich (S=P).

Po chwili zastanowienia przyszła mi jednak do głowy myśl, że kontrolerom może się opłacać kontrolować tylko część osób (0<S<P),
z dość niemoralnego powodu: po to by zachęcić ludzi do jeżdżenia na gapę.
Zakładając pewną koordynację ze strony pasażerów, mogą oni sobie wyliczyć, że ryzyko zostania skontrolowanym wynosi S/P.
Tu zakładam dodatkowo, że wzorzec kontroli jest nieprzewidywalny dla pasażera.
W takim razie bilet opłaca się skasować wtedy i tylko wtedy gdy b < f*(S/P).
Tutaj znów na pozór widać czarnobiały świat: albo ta nierówność zachodzi i wtedy wszyscy kasują bilety (G=P),
albo nie zachodzi i wtedy nikt nie kasuje biletu (G=0).

Po pierwsze rodzi to super ciekawe pytanie czy może dojść do niestabilnej sytuacji, w której
MPK organizuje 100% kontrole (S=P), co powoduje, że wszyscy zaczynają kasować bilety (G=P), co z kolei
powoduje, że MPK przestaje się opłacać kontrolować (S=0), co znów powoduje, że nikt nie kasuje biletów (G=0) i kółko się zamyka.

Po drugie: czy może w ogóle być inaczej, tj. czy może dojść do ekwilbirium w tym czarnobiałym świecie?

Po trzecie: czy da się stworzyć stabilną sytuację w której S lub G mają pośrednie wartości? Przy okazji chciałbym zauważyć, że o ile
0<S<P można łatwo wcielić w życie (np. zatrudniając odpowiednią liczbę kontrolerów), o tyle wymuszenie 0<G<P wymaga jakiejś formy koordynacji
ze strony pasażerów. O ile umiem sobie wyobrazić, że pasażer przed wejściem do tramwaju rzuca kostką by ustalić czy skasować bilet, to
trochę trudniej zapewnić, że może zaufać pozostałym pasażerom, że zrobią dokładnie to samo. Dlaczego? Bo jeśli są naprawdę samolubni,
to lokalnie optymalnym posunięciem jest albo skasować bilet albo go nie skasować, losowanie nigdy się nie opłaca (coś jak dylemat więźnia).

Po czwarte: może warto by było rozważyć modele, w których ludzie różnią się co do moralności i odporności na stres i co za tym idzie różnie wyceniają koszt jechania bez biletu?

Ad 1. Chyba tak:

P = 100 000
t = 2 pln
k = 0.10 pln
b = 3 pln
f = 100 pln

I zaczynamy od sytuacji gdy nie ma gapowiczów, G=0.
Wtedy 0.10 pln = k > f*G/P = 0 pln, czyli nie opłaca się robić kontroli, więc S=0.
Wtedy 3 pln = b > f*S/P = 0 pln, czyli nie opłaca się kasować, więc wszyscy zaczynają jechać na gapę, G=P.
Wtedy 0.10 pln = k < f * G/P = 100 pln, więc opłaca się robić kontrole, S=P.
Wtedy 3 pln = b < f*S/P = 100 pln, więc ludzie przestają jeździć na gapę G=0.
Kółko się zamyka.

Ad 2. Chyba jest to możliwe tylko wtedy, gdy kara nie przewyższa ceny biletu (f <= b) lub kosztu przeprowadzenia kontroli (f <= k).
Ale świat, w którym zachodziłby któryś z tych warunków wydaje się intuicyjnie głupi.
Zakładając, że f>b oraz f>k, sytuacja zawsze będzie się kręciła w kółko.
Ok jest jeszcze case że ceny lub kary są ujemne, ale to już w ogóle absurd.

Ad 3. Zdałem sobie sprawę, że to trochę zależy od tego jak definiujemy "stabilność" a konkretniej między kim a kim jest ta gra.
Jeśli graczem jest "ogół pasażerów" to sytuacja wygląda inaczej niż jeśli są nimi "pojedynczy pasażerowie".
W tym drugim przypadku jak już pisałem, opłaca się albo kasować albo nie kasować i już.
Załóżmy więc, że pasażerowie umieją się skoordynować na tyle by wymusić jakąś wartość G inną niż 0 lub P.
Pytanie tylko po co mieliby to robić? Co oni optymalizują?
Oczywiście powinni minimalizować swój sumaryczny wydatek, czyli (P-G)*b + G*(S/P)*f = P*b + G(f*S/P - b),
co oczywiście nadal prowadzi do czarnobiałego rozwiązania, chyba, że pozwolimy pasażerom zastanowić się nieco dalej wybiegając w przyszłość
i rozważyć jak na ich zachowanie odpowiedzą kontrolerzy (o których znów należy założyć, że będą działali roztropnie w oparciu o jak najlepszy model
przyszłych poczynań pasażerów itd.).
Zaczyna mi być trudno prowadzić to rozumowanie - nie bardzo czuję, dlaczego strategia "szara" miałaby w ogóle mieć sens.
Po części trudność wynika chyba z tego, że mieszam ze sobą statyczną sytuację (jeden dzień) z dynamiczną (wielorundowa gra) nijak nie modelując upływu czasu.
Jakaś część mnie wierzy, że hasło "hej, niech tylko 2% z nas jeździ na gapę, wtedy nie będzie się im opłacało nas kontrolować",
wydaje mi się potencjalnie słuszną radą w jakimś świecie, ale nie umiem do końca wskazać w którym.
Spróbuję więc podejścia, które czasem działa: najpierw policz rozwiązanie, a potem się zastanów czemu ono jest rozwiązaniem.
Mam przecież sporo nierówności które mogę przerobić na równości i zobaczyć czemu one odpowiadają.
Przykładowo co by się stało gdyby b = f*S/P?
Z jednej strony oznacza to, że pasażerowi nie robi różnicy czy skasuje bilet, czy nie.
To o tyle dobre, że mógłby wtedy być skłonny zastosować się do jakiejś globalnej strategii nie czując, że na tym traci.
Problematyczne może być to, że b,f,S występujące w tej równości są kontrolowane przez MPK a nie pasażerów.
Dla MPK oznacza to, że może tak je dobrać, by zagwarantować sobie wpływy od pasażerów równe P*b.

Tu w sumie warto zadać sobie pytanie, co w ogóle powstrzymuje MPK przed ustawieniem f lub b na 10000000pln.
Chyba pora dodać do modelu jakieś założenie co do wartości jaką dla pasażerów ma transport.

Niech:
u = wartość jaką dla pasażera ma przejazd (w porównaniu do alternatyw i uśredniając po wszystkich)
To jest oczywiście niepoważne założenie, że ludzie znają u i że jest ono stałe dla wszystkich, ale ja się dopiero uczę! :)

W obliczu braku koordynacji z innymi pasażerami, czyli podejmując decyzję egoistycznie, pasażer powinien chyba postąpić tak:
Sprawdź która z liczb: u, b, f*S/P jest najmniejsza.
Jeśli b, to skasuj bilet.
Jeśli f*S/P, to jedź na gapę.
W przeciwnym razie pójdź pieszo/rowerem/autem/zostań w domu, bo nie opłaca się jechać.

Ale jak to jest przy koordynacji ze strony pasażerów, tj. np. rzucam kostką by ustalić czy skasować bilet?
Czy może mi się "opłacać" jechać nawet gdy kostka każe mi zrobić coś co przekracza wartość u?

Poza tym, czy wprowadzenie do modelu parametru u, w ogóle rozwiązało problem astronomicznie dużych kar?
Ogłoszenie, że f=1 000 000 pln, spowoduje raczej tylko tyle,
że ludzie zaczną kasować bilety, o ile tylko b<u. Jakie mogą być negatywne konsekwencje tak wysokich kar dla MPK?
Ja nie widzę. Czyżby więc to, że w praktyce są one niskie (około 100 pln) ma być zachętą do jeżdżenia na gapę?
Czy można interpretować ten stan rzeczy jako dowód na to, że cena biletu przekracza jego wartość (b>u)?
Czy MPK może się opłacać celowo obniżyć f do "akceptowalnego" poziomu po to by zarabiać więcej niż gdyby wszyscy kasowali bilety?
A może to forma segmentacji rynku na gapowiczów i uczciwych i nie da się tego zrozumieć dopóki mój model nie uwzględni różnić w moralności/odporności na stres?

Spróbuję na nowo skupić się na problemie ekwilbrium.

P = 100 000
t = 2 pln
k = 0.10 pln
b = 3 pln
f = 100 pln
u = 5 pln

Rozważmy sytuację gdy gapowiczów jest dokładnie G=99.
Wtedy spodziewany zysk z kontroli f*G/P - k = 100 * 99/100 000 - 0.10 = 0.099 - 0.10 = -0.001 jest ujemny, więc nie opłaca się kontrolować, więc S=0.
W sytuacji gdy nikt nie kontroluje, pojedynczemu egoistycznemu pasażerowi opłaca się nie kasować biletu.
Ale gdy tylko liczba gapowiczów wzrośnie do 101, kontrole zaczną się opłacać co może doprowadzić do S=P.
Jeśli więc pasażerowie są w stanie wymusić posłuszeństwo, to ich dzienny koszt będzie wynosił:
P*b + G*(f*S/P - b) = 300 000 + 99*(0 - 3) = 299703
czyli mniej niż 300 000 gdy się nie dogadają.
Para G=99, S=0 wydaje się przy tym stabilna.
Ale nie wiem czy dostatecznie głęboko przemyślałem strategię kontrolerów.

A czy da się w drugą stronę, tj. tak, żeby G=0, 0<S?
Skoro nikt nie jedzie na gapę, to musiałoby być jakoś tak, że b jest ciut mniejsze od f*S/P, czyli S > b*P/f = 3*100 000 / 100 = 3000.
Rozważmy zatem sytuację, w której mamy S = 3001.
Wtedy koszt pasażerów, czyli P*b + G*(f*S/P - b) jest minimalny wtedy gdy G=0.
Czyli wszyscy kupują bilety i MPK zarabia P*b - S*k = 300 000 - 3001*0.10 = 299699.9 pln.
Pasażerom raczej nie opłaca się żadna inna strategia.
Pytanie czy MPK opłaca się zmienić liczbę kontrolerów w tej sytuacji?
MPK zarabia tyle ile płacą pasażerowi minus koszt kontroli: P*b + G*(f*S/P - b) - S*k.
Pochodna po S to f*G/P-k i oczywiście dla G=0 cięcia w liczbie kontrolerów wydają się sensowne.
Tylko, że jeśli zmniejszy się ich liczbę do 2999, to wtedy nagle zaczyna się opłacać jeździć bez biletu.
Dla S = 2999, najlepszą dla pasażerów strategią na zminimalizowanie P*b + G*(f*S/P - b) jest jeździć na gapę.
Tzn. przynajmniej jeśli są oni egoistyczni, bo nawias (f*S/P-b) jest ujemny. Ale co jeśli działają zbiorowo?
Zbyt duża liczba gapowiczów, zwiększy kontrole z powrotem do S=3001 i znów nie będzie się opłacało jeździć na gapę.
Czy istnieje więc jakaś taka mała ale niezerowa liczba gapowiczów, która z jednej strony pozwala cieszyć się
z tego, że kontrolerów jest mniej niż 3000, a z drugiej strony nie alarmuje ich tak bardzo?
Liczba kontrolerów na pewno wzrośnie, gdy f*G/P przekroczy k.
Zatem co się dokładnie stanie, jeśli wybierzemy G ciut mniejsze od k*P/f = 0.10*100 000/100 = 100?
Hm, dostaniemy G=99, czyli tę samą wartość którą rozważałem poprzednio.
Czyli o jest bezpieczna dla pasażerów wartość G bo nie zmienia polityki MPK.
Wydaje się, że im większe G tym taniej dla pasażerów, ciekawe czy mogłoby być jeszcze większe?
Nie jestem wcale pewien, że przy G=101, najmądrzejszym ruchem MPK jest zwiększyć S. Kto wie.
Na razie wyszło mi, że zmniejszenie liczby kontroli z S=3001 do S=2999 może wywołać zwiększenie G do 99,
a wtedy MPK będzie zarabiało P*b + G*(f*S/P - b) - S*k = 300 000 + 99*(100*2999/100 000 - 3) - 2999*0.10 = 299700.001
czyli ciut więcej niż przy S=3001.
Hm, to nie brzmi jak groźba, tylko jak okazja.
No ale może po prostu G=99 to nie jest najgroźniejsza odpowiedź pasażerów?
Co gdyby zagrali G=100?
Wtedy, z ich punktu widzenia P*b + G*(f*S/P - b) jest nawet mniejsze niż dla G=99.
Dla MPK zysk wyniesie wtedy P*b + G*(f*S/P - b) - S*k = 300 000 + 100*(100*2999/100 000 - 3) - 2999*0.10 = 299700,
czyli wciąż lepiej niż dla S=3001.

Damn, to jest naprawdę frustrujące, że nie wiem jak zamodelować tę grę (as in: nie umiałbym napisać programu, który to liczy).
Główną trudność widzę w tym, że niektóre ruchy mają "oczywisty natychmiastowy sens", a niektóre mają sens dopiero
jak się rozważy co zrobi przeciwnik itd itd. Gdzie ta rekurencja ma bazę?

A może to jednak trzeba rozpatrywać z podziałem na rundy.
Np. jako grę dwurundową: w pierwszej rundzie MPK ustala S, w drugiej pasażerowie ustalają G i koniec.
Albo na odwrót. Albo jakaś skończona liczba rund?
Chyba żadna skończona liczba rund "nie jest ciekawa", bo w ostatniej rundzie opłaca się wtedy zagrać ekstremalnie.
A zatem muszę się skupić na tym absurdalnej "nieskończenie długiej a jednak natychmiastowej" rozgrywce.

Spróbuję zgadnąć ekwilibrium: G=100, S=3000.
f*S/P = 100 * 3000 / 100 000 = 3 = b, więc nie ma znaczenia czy kupię bilet czy nie.
Podobnie: f*G/P= 100 * 100 / 100 000 = 0.10, więc nie ma znaczenia liczba kontroli.
Czy to sie liczy jako ekwilibrium? Raczej nie, to chyba swego rodzaju przeciwieństwo: sytuacja bardzo niestabilna chyba, że założymy jakąś niechęć do zmiany:)

To może plus minus epsilon: G=99, S=3001.
f*S/P = 100*3001/100 000 = 3.001 więc na oko opłaca się zmniejszać G
f*G/P = 100*99/100 000 = 0.099 więc może opyla się zmniejszać S

To może plus minus epsilon: G=99, S=2999.
f*S/P = 100*2999/100 000 = 2.999 więc na oko opłaca się zwiększać G
f*G/P = 100*99/100 000 = 0.099 więc może opyla się zmniejszać S

Sam nie wiem... Na pewno nie jest dobrym pomysłem ten programik:

var P = 100000;
var G = 99;
var S = 0;
var k = 0.10;
var b = 3;
var f = 100;
for(var i=0;i<1000;++i){
  if(f*S/P < b){
    if(G<P)G++
  }else{
    if(G>0)G--
  }
  if(f*G/P > k){
    if(S<P)S++
  }else{
    if(0<S)S--
  }
  console.log("#"+i,S,G,f*S/P,f*G/P)
}
bo on patrzy zbyt zachłannie/lokalnie/egoistycznie.

Czy ruchy polegające na zwiększeniu liczby kontroli do S=P tylko po to by zupełnie zniechęcić ludzi do jazdy na gapę, nawet jeśli
koszt przeprowadzania takiej kontroli jest kosmiczny, mają sens?

Może to jednak powinno być rozważane jako nieskończony ciąg dni: S[0],G[0],S[1],G[1],... w którym obie strony optymalizują wartość
nieskończonej sumy (co by to miało znaczyć??) biorąc pod uwagę, że przeciwnik może postępować wg strategii oko za oko ząb za ząb
i inne tego typu "iterowane dylematy więźnia"?




Popularne posty z tego bloga

Szczęście jako problem inżynieryjny

Kilka rzeczy, o których żałuję, że nie powiedziano mi, gdy byłem młody

Produkt: Ojciec*