Huvudsyftet med denna studie var att utvärdera olika klustringsmetoder för att analysera data hämtade från en läkemedelsstudie där cytokinprofiler hade genererats från 23 olika läkemedel. Hierarkisk klustring användes eftersom antal kluster inte var förutbestämt. Olika distansmått och s.k. länkfunktioner utvärderades för hierarkisk klustring. Utvärderingen av de olika distansmåtten visade att Pearsons korrelationskoefficient lämpade sig bäst vid klustring av de olika läkemedlen eftersom likheter i mönster var viktigare än de faktiska mätvärdena. Även fyra länkfunktioner för att slå samman kluster utvärderades. Den länkfunktion som beräknade medelavståndet mellan objektens kluster visade sig vara den optimala metoden baserat på robusthet och korrelation mellan avstånden i dendrogramet och avstånden i distansmatrisen. Genom att använda hierarkisk klustring baserat på Pearsons korrelationskoefficient och medelavstånd så kunde ett antal intressanta läkemedelsgrupper identifieras. De s.k. JAK-inhibitorerna grupperades i ett distinkt kluster medan calcineurin inhibitorerna återfanns i ett robust kluster tillsammans med proteinkinasinhibitorer. Denna studie visar att klustring av läkemedel baserat på cytokinprofiler kan erbjuda viktig information som beslutstöd för framtida projekt inom läkemedelsutveckling, samt att avstånd baserade på Pearsons korrelationskoefficient och att en länkfunktion som beräknar medelavstånd lämpar sig bäst för den här typen av data.
The aim of this study was to evaluate different hierarchical clustering techniques for data obtained from a study where cytokine profiles had been generated for 23 different drugs. Both distance metrics and linkage functions were evaluated. The evaluation of the distance metrics showed that the Pearson correlation coefficient was the most appropriate distance metric since similarity in patterns of the profiles was more important than similarity based on the actual values. Out of the four evaluated linkage functions: single, complete, average and Ward’s, the average linkage function was the best clustering method based on the cophenetic correlation and the bootstrap probability value. Using the Pearson correlation clustering with the average linkage function, the JAK inhibitors were successfully clustered and the calcineurin inhibitors were found in a robust cluster together with protein kinase inhibitors. This study indicates that cytokine profiles from drugs may provide valuable information where similar drugs can be found in the same clusters. In addition, the study shows that the Pearson correlation coefficient and the average linkage functions were the most appropriate distance metric and linkage function, respectively, for this type of data.