Spelrum
Giraffen44
Krokodilen0
Elefanten0
Musen
Böjningslistan
0
Grisen
Böjningslistan
19
Inloggade63
Mobilspel
Pågående20 532

Forumkategorier

Användare Inlägg  
ordvältaren - Ej medlem längre2008-05-12 15:42
Antal inlägg: 2483

BYXJULP
 
Mårten2008-05-12 18:55
Antal inlägg: 2529

Att de skrivs med stor bokstav är väl en anledning så god som någon. Det gör dem inte så svåra att skilja ut heller.

Att MAGNECYL och ASPIRIN går men inte *TREO eller *ALVEDON har jag ingen förklaring till. I min värld är treo lika mycket som magnecyl ett ord som slutat att hänvisa till just varumärket "Jag har ont i huvudet, har du nån treo?" betyder ju inte att det är just treo man vill ha utan vilken tablett som helst som lindrar huvudvärk. Om man däremot frågar efter *SYNERPIL eller *ZELDOX kanske man inte ger vilket annat liknande medel som helst. Då de i mina ögon är mer eller mindre godtyckliga föreligger ju risken/chansen att magnecyl trillar bort om man börjar kräva att ett ord ska finnas i fler än en ordlista med liten bokstav. Mitt intryck av engelska scrabbleordlistan är att den är hiskeligt restriktiv med varumärken. ASPIRIN går inom området piller men jag känner inte till något annat.

Skillnaden mellan TRANDANS och MORAKLOCKA å ena sidan och ÖSTERSJÖN och DALSLAND å den andra, som gör den ena legitim och den andra till en inkräktare i ordlistan, är som jag ser det att trandans och moraklocka också kan användas generellt. "Jag har sett trandans arton gånger i år", "jag har fem moraklockor", även med lite vilja blir det svårt att konstruera meningsfulla generaliseringar som innehåller ordet ÖSTERJÖN utan att referera till just vattnet som skiljer Sverige från Finland. Det finns många geografiska områden som jag ser som mer rimliga på denna grund än DALSLAND. Till exempel Beirut ("Gå inte in för guds skull, jag har inte städat i år än så det är totalt beirut där inne"). Jag har svårt att se varför ÖSTERBOTTEN ska stå med men inte SAVOLAX eller BIRKALAND om man ändå ska börja lista finska landskap, och om kriteriet "välkänd" med hänvisning till nutiden ska vara med tror jag att samtliga amerikanska delstater platser före något finskt landskap.

Då det inte finns någon tydligen gräns mellan Atlanten och Gjirokastra, då båda är geografiska företeelser som bara finns i ett exemplar. Varför då inte dra gränsen vid stor bokstav, det enda säkra sättet att skilja dumma ord från snälla ord?

Citerar följande från reglerna för sällskapsspelet Scrabble, som oavsett vilken ordlista man använder inte tillåter egennamn:

"Before the game begins, all players should agree upon the dictionary that they will use, in case of a challenge. All words labeled as a part of speech (including those listed of foreign origin, and as archaic, obsolete, colloquial, slang, etc.) are permitted with the exception of the following: words ALWAYS CAPITALIZED, abbreviations, prefixes and suffixes standing alone, words requiring a hyphen or an apostrophe."

Vad gäller upphovsrätt anser jag att grävaren är inne på rätt spår. Om man inte bara tar en union av t.ex. SAOL och NEO, vilket säkerligen skulle leda till upphovsrättsliga problem, så tror jag en en ny ordlista som består av ord som förekommer i flera av "alla kända" svenska ordlistor skulle vara mer juridiskt gångbar. Speciellt om man inte bara tar ord från utan också sållar bort defekta ord från saol (hej då ÖSTERSJÖN) och de andra ordlistorna i enlighet med vad som föreskrivs i reglerna för Scrabble. En ordlista som är definierad som "ordlistan som innehåller allt som inte är unikt för en enskild ordlista" kan ju inte gärna ses som ett intrång i en specifik ordlista).

Jag är för övrigt inte alls främmande för att stryka förkortningarna som nu är godkända heller. Förutom att det mig veterligt inte finns något land förutom Sverige som har scrabblespelare som godkänner egennamn så finns det inte heller vad jag vet några som godkänner tv, cd, dvd eller ddt. Eftersom reglerna för Scrabble bannlyser förkortningar.
 
y not2008-05-12 20:45
Antal inlägg: 9014

intressant inlägg Mårten. Vad gäller egennamn håller jag med dig, men när det gäller förkortningar så anser att ord som tv cd och bh är ordpå precis samma sätt som laser och bil. Sen kan man ju alltid diskutera vilka forkortningar vi tycker är ord och vilka egennamn/varumärken som blivit or. Och just det tycker jag är poängen med att ta fram en egen ordlista. Em idé som tilltalade mig från allra första början då man ju själv bestämmer formen utifrån spelet.
Problemet som jag ser det är ju hur den skall tas fram, men framför allt av vem och så fort några är villiga att göra det som ju denna tråden ger ett stor hopp om så har det mitt stöd.
Och upphovsrättsligt kan jag inte heller se nåt problem om man plockar till och från ord från olika håll så blir det ju ett eget och unikt verk.
 
Mårten2008-05-12 20:56
Antal inlägg: 2529

Att framställa en ordlista från andra befintliga ordlistor efter givna kriterier är ju inte vidare svårt i denna dataålder. Jag tror att det är just det som ordgrävaren pysslar med just nu. Problemet är bara ordlistorna och kriterierna.

Sen i slutänden måste den väl korrekturläsas också men scrabble-sverige är ju lyckligtvis ett reservat för folk som helt saknar både liv och strömlinjeformade uppfattningar om hur mkt tid man kan lägga ner på något för en utomstånde betraktares ögon HELT meningslös projekt.
 
dudeniro - Ej medlem längre2008-05-12 21:01
Antal inlägg: 6214

(Mårten - tack! Försökte komma ihåg vad boken hette "Word Freak". Jag tipsade ordvältaren om den en gång, men det kom den rackaren inte ihåg och när jag skulle tipsa honom igen hade jag glömt bort titeln. Nu är jag lycklig igen.)
 
ordvältaren - Ej medlem längre2008-05-12 22:31
Antal inlägg: 2483

y not, vad gäller utformningen så är det väl lika bra att skaka fram några sakkunniga som dig själv och mårten som kan diskutera saken utifrån ett scrabbleverbundskt perspektiv. Så vitt jag kan förstå finns det vissa regler så det man bör enas om är väl egentligen ordkällor.

Själv är jag inte främmande för att använda ord från saol10 och framåt i kombination med andra stora ordlistor. NE, Norstedts, Saol, Dsso, det finns några stycken att välja på men inte alls lika rikt som hos engelskans. Listan skulle skilja sig en del från den vi har idag, den skulle nog bli ordrikare i de spelbara längderna men tappa en hel del sammansatta ord av de längre typerna.

Framgrävandet har i vilket fall som helst påbörjats, listan kommer framställas om vi inte springer på några oförutsedda hinder eller juridiska problem.
 
E Solu - Ej medlem längre2008-05-13 03:31
Antal inlägg: 4715

Jag har gjort en simpel spindel nu som funkar rätt bra. Dock låter jag bli att böja orden än så länge, och samlar bara ihop alla i ett histogram. Vill man kan man ju alltid reducera orden genom att addera frekvensen för samtliga böjningar till ordstammen. :)

En sak som är väldigt intressant, så här på rak arm, är det faktum att ett ord sticker ut ur statistiken. Jag har testat att spindla dn.se, aftonbladet.se, realtid.se, och blogg.se. C:a 100 länkar från varje sida. Det vanligaste ordet tenderar att vara och/att/det/i/på osv. MEN, på de länkar jag följde från blogg.se var JAG det vanligaste ordet. Hela 4386 förekomster, jämfört med OCH.

Nu har jag visserligen bara gjort en ytlig spindling på 30 sekunder, men jag slår vad om att statistiken skulle hålla om man jämförde bloggosfären mot dagspressen. En jag-revolution har inletts i och med Internet. Egoismen är på frammarsch. Det är positivt.
 
E Solu - Ej medlem längre2008-05-13 03:38
Antal inlägg: 4715

Oj, det blev lite fel i texten där... Nåja. Så här ser i alla fall topp-20 listan ut från aftonbladet, från 100 godtyckligt valda texter från länkar på förstasidan:
i 5496
på 3456
och 3158
att 2459
för 2449
med 2180
är 2012
till 1945
det 1939
om 1895
du 1725
av 1632
som 1534
en 1496
se 1467
aftonbladet 1390
här 1365
har 1320
jag 1289
de 1247

Så här ser motsvarande lista ut från blogg.se:
jag 4241
och 3836
det 3156
att 2754
på 2713
i 2681
är 2280
en 2018
så 1857
som 1781
har 1608
med 1552
inte 1454
för 1327
till 1318
kommentarer 1179
men 1175
vi 1123
permalink 1031
nu 1027

Rätt fascinerande. ;)

Totalt hittade jag 16214 unika ord på bloggarna vid denna sökning, och 8232 unika ord på aftonbladet. Detta är kanske inte lika förvånande.
 
E Solu - Ej medlem längre2008-05-13 03:45
Antal inlägg: 4715

Annan kul statistik. Aftonbladet hade 54 varianter av attack, 116 varianter av chock. Motsvarande på bloggarna var 11 samt 4.
 
E Solu - Ej medlem längre2008-05-13 03:48
Antal inlägg: 4715

Här är spindeln om nån vill fortsätta: pastebin.org/35554
 
y not2008-05-13 07:40
Antal inlägg: 9014

Underbart. Ett sådant resultat som E Solu spindlar fram är helt klart vettigt att ha med i en sådan ordlista, sen vid vilken frekvens man skall dra gränsen kan ju alltid diskuteras, och så var det det där med böjningar. Men jag ser fram emot att få rulla *PERMALINK
 
E Solu - Ej medlem längre2008-05-13 13:09
Antal inlägg: 4715

Ska nog passa på att göra en lite förbättrad variant och spindla några tusen sidor från gigabitlina nu. :)
 
E Solu - Ej medlem längre2008-05-13 15:05
Antal inlägg: 4715

1000 aftonbladetsidor spindlade, spindlar 10000 svd-sidor också. Får se om det blir nåt vettigt resultat att jobba vidare med.
 
Dyslekso2008-05-13 15:07
Antal inlägg: 8945

E Solus
SPINDELCHOCK
uppskattas av
ORDNÖRDAR

Nu kommer sommaren - 21 dygnsprognos i dagens tidning
 
ordvältaren - Ej medlem längre2008-05-13 15:28
Antal inlägg: 2483

Ta lite DN också
 
E Solu - Ej medlem längre2008-05-13 15:41
Antal inlägg: 4715

Får se vad jag hinner med. Jag skulle i och för sig kunna göra flera sidor samtidigt med tanke på att bandbredden och processoranvändningen inte är någon flaskhals. Än så länge är jag uppe i 44000 unika ord kortare än 15 bokstäver, och 3000 unika ord längre än 15 bokstäver på svd.se. Men jag har lite vettigheter att göra också :)

/Spindelmannen
 
E Solu - Ej medlem längre2008-05-13 16:21
Antal inlägg: 4715

img211.imageshack.us...ot 3od5.png Hehe :P Nu väntar jag bara på att polisen kommer och fängslar mig för DoS. Men sånt får man ta i grävbranschen.
 
E Solu - Ej medlem längre2008-05-13 16:38
Antal inlägg: 4715

Här är topplistan från DN:
aktie 408
och 388
se 381
ab 324
dn 311
på 295
till 275
fonder 254
nyheter 248
du 242

Spindeln dog efter bara 11 länkar eller nåt sånt, sen hittade den ingen mat.
 
satsuma - Ej medlem längre2008-05-13 16:40
Antal inlägg: 340

Jag undrar om den började på ekonomisidorna.... ;)
 
ordvältaren - Ej medlem längre2008-05-13 16:47
Antal inlägg: 2483

Hur många unika ord blir det om man bara ser till grundformer?
 
Visar sida: 1 2 3
Inloggning
Logga in
Betapet är gratis!
Vill du bli medlem?